Augustine Cheng's comment on NATGATE. All Comments

Augustine Cheng
2 Like · Reply
快点破两块,等加码。
Janbert Fong
去读读deepseek vs chatgpt吧… 对你的加码有好处哦
1 Like · 3 days · translate
Augustine Cheng
我正在研究deepseek,昨晚有尝试了,打算等下拿它来写法理学jurisprudence essay,跟chatgpt比较。我觉得deepseek应该在edge ai(在自家电脑offline运行),数理和中文知识储备上会比较占优势。跟natgate有什么关联吗?请教。
1 Like · 3 days · translate
Peng Zhong Wong
吹牛不用本钱,天天讲自家的cpu有多厉害超越了什么什么,测试的时候就什么什么
2 Like · 3 days · translate
Ming Ooi
狼哥可以去看看,Fb (遠行的理由) 有提到Deepseek用多少GPU算卡,研发了多少钱 。 Deepseek 是不是 报假数
3 Like · 3 days · translate
Augustine Cheng
好的,回去看。

跌破了。
1 Like · 3 days · translate
黄耀新
收盘价好意头188... 一直发发, 今天尾盘买进一点, 明日再跌多几分再分批再买进,知彼知此, 百战百胜。
1 Like · 3 days · translate
Ming Ooi
为何一直拿手套来比?讲多无益
看好的继续买,看不好的可以离场
1 Like · 3 days · translate
Augustine Cheng
三小时实测Deepseek结果

//

花了三个小时来测试Deepseek,用它写大学法理学jurisprudence文章,打算如果效果好的话,用它来协助写论文。我用免费版本的Deepseek R1,ChatGPT-4o和Claude3.5 Sonnet,用它们三个写同样题目。直接给结论,Deepseek写得最好。拿Deepseek的文章去给Chatgpt和Claude评论,它们也觉得比它们自己的文章写得更好。文章和交叉评论,我都是一字一句地仔细阅读,还做了几个额外的尝试,因为我是认真要用它写论文的,我需要认真评测它的虚实。一通折腾下来,耗时6个番茄钟,也大约就是三小时。

//

Deepseek的文章写得更有深度,把课题分析得更深入,更有层次,似乎有产生新想法的能力。而其他两个模型分析得较浅,流于描述性质,读起来像是浅白的法普范文,似乎只是重组训练资料,没有给人带来新想法的感觉。Deepseek无疑是推理能力更强,做推理时细致不敷衍。因为推理能力强,它比你更了解你自己想要问些什么,不需要特别的prompt也能问出合心意的答案。到网上截取资料后,它会用自己的推理能力,把资料筛选和整合并加以论述。这点很强悍,这样就不需要初始训练资料的完整性,它可以用自己的逻辑推理,在投入运作的过程中从网络学习,做中学。而免费版的chatgpt开启联网后就很敷衍,做不到这点,付费的不清楚。从网上也看到,答错的题目,如果再问它一次,它会给你正确答案,它似乎有自行上网搜索纠正自己并存进长期记忆的能力。Deekseek也公开它的推理过程,这点是其他两个闭源大模型所缺乏的。参考它的推理过程,可以让我们人类自己学会更好地推理,也更有可能监控它的发展趋势,以免它反噬人类。另外,听说数理方面,也是Deepseek的推理能力更强,这点还没测试。

//

虽说网页免费版本没有硬性规定每日token限制,但缺点是单个聊天框的token太少,用一下子就必须开新的聊天框。这在某种程度上限制了我们个人进行大型项目的纵深,每次开新的对话框后,都需要概述一遍之前的需求和成果,才能完成一个大项目。付费能解决这难题。另外一个缺点是当机,可能是这几天突然爆红,他们的服务器负荷不来,用一下子就会当机,这点是硬伤。

//

Deepseek作为开源的模型,比其他模型来得小,推理能力又更强,这些都有利于企业或个人把它安装在自家电脑使用,专业术语叫edge AI。这么说来,data centre搭建起来的cloud AI是否还有未来?毋庸置疑,cloud AI还会是主流,显卡还是要继续卖,data centre还是要继续建,因为edge AI的功能肯定不及cloud AI,这是硬件算力所决定的,自家电脑肯定比不上data centre的超级电脑。Deepseek释出的小模型版本只可能是阉割版,能力上肯定不及大模型版本。未来,cloud AI和edge AI一定是以互补的形式存在,需要算力强的工作由cloud AI完成,需要隐私和快反应的工作edge AI代劳。

//

如果光靠AI程序更优越,体积更小,AI厂家是否就能摆脱拼命堆算力的宿命?日后,他们对于显卡的需求会否因此而下降?中国是被制裁才激发出在软件上的创新,以此弥补硬件上的不足。如果哪天特朗普开闸了,说可以给中国厂商采购最高阶的显卡,到时更好的软件配上更好的硬件,好上加好,如虎添翼,试问他们会拒绝吗?美国的AI大厂也会不断优化他们的AI程序,芯片大厂也会不断推出算力更强的显卡,软件和硬件交替迭代优化是不变的定律,这本身就是一件再正常不过的事情。再说,Deepseek真的不需要堆算力搭建起来吗?就说Deepseek的训练吧,Deepseek肯定是花了天文数字搭建初始算力才有办法训练出这么优越的模型: https://www.facebook.com/avocadoeater/posts/pfbid0wyfz2J2nCU5SEAL4GSYqMvT8pYGHUUDS7BFXbAFk4qH5tpFgqKMY751JRL5H29D4l 。(感谢Ming Ooi的推荐文章)这肯定不止500万美元,500万只是训练模型时租用算力的费用,其他的什么都不计。如果照同样算法计算,ChatGPT在训练时租用算力的费用也是在同一个数量级上,根据Deepseek给出的数据是600万到2000万美元之间。所以,别听媒体瞎说。看来,显卡和data centre这种基础设施还是刚需,此次回调是好机会,我跟自己说的,非投资建议。

//

如果有兴趣,可以到最爱的狼Facebook专页看三个大模型写的文章:
https://www.facebook.com/Zuiaidelang/posts/pfbid02oPZg9U9SdoGF3n1eQujZdQBt6jqJ3yB1JWxE9mh3Qhu4Wuh4v1P9KVLJfd7y4wwal
Show more
1 Like · 2 days · translate
黄耀新
1.75也进了一点, 期望1.60快点来到...........
1 Like · 2 days · translate
Do Do
1月28日消息,DeepSeek于服务状态页面公告称:近期DeepSeek线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式。

DeepSeek称,已注册用户可以正常登录,感谢理解和支持。

据此前报道,DeepSeek深度求索的崛起不仅引发硅谷怀疑美国在人工智能领域领先地位,也动摇投资者对人工智能行业对高科技芯片的巨大需求信心。
Show more
1 Like · 2 days · translate
Do Do
中国企业深度求索开发的低成本、高性能大语言模型DeepSeek-R1冲击美国科技股,导致美国人工智能巨头英伟达股价暴跌,市值蒸发近6000亿美元(约2.6兆令吉)。

深度求索的崛起不仅引发硅谷怀疑美国在人工智能领域领先地位,也动摇投资者对人工智能行业对高科技芯片的巨大需求信心,促使投资者星期一(1月27日)纷纷抛售全球科技股。

科技股占主导的美国纳斯达克指数星期一下跌3.1%,其中英伟达成最大拖累,股价下跌近17%,市值蒸发5927亿美元,创下华尔街股票市值单日最大跌幅的纪录。

据伦敦证券交易所(LSEG)数据显示,英伟达星期一的市值损失超过去年9月单日纪录的两倍。

此外,费城半导体指数也下跌9.2%,写下自2020年3月以来的最大单日百分比跌幅,跌幅最大的是芯片
Show more
1 Like · 2 days · translate
Do Do
科技大战,贸易大战,有赚到的,见好就收。 市场会更动荡和乱, 爽爽就冲,爽爽就跌,一切手感触感为快,大家加油,新年发大财
1 Like · 2 days · translate
黄耀新
1.60以下再来布置, 有人说会下到1.20,甚至会下到1.00, 听是他们是对的, 但我是走自己的路, 是否太固执。
Like · 2 days · translate
黄耀新
还以为今天只有半日的交易。
Like · 2 days · translate