《Kimi人工智能月度报告丨AI人物观点》</p>
关键词:算力十问</p>
1.沈向洋:大模型将横扫所有垂直行业</p>
“大模型大到一定地步以后就涌现出来。多大才涌现出来?没人讲得清楚。”3月23日,2024全球开发者先锋大会在上海开幕,美国国家工程院外籍院士沈向洋在《大模型时代的机遇和挑战》的演讲中分享了关于大模型的五方面思考。</p>
第一,大模型的到来,强迫人类重新思考人机关系。“我们受到的冲击,到底有多少是机器智能的发展,有多少是人机交互的震撼。”他认为,不管是什么技术,最终目的是帮助人更好运用机器,不忘初心。</p>
第二,大模型将横扫所有垂直行业。大模型可分为通用大模型、行业大模型、企业大模型和个人大模型。“一个通用大模型如果没有万卡、不上1万亿参数,基本上以后就不太好意思说这是一个通用模型了。行业大模型大致上是千亿参数、千亿卡的训练规模。企业大模型可能只需要100张卡、百亿参数。最有意思的是个人大模型,利用个性化参数,结合云和端,这是非常有意义的。”</p>
第三,算力是门槛。影响算力的两大因素是模型大小和数据规模,随着参数增加,对算力的需求几乎是几何级的。“千卡万卡是钱堆出来的。以前有一句话叫贫穷限制想象力,现在贫穷可能扭曲想象力,因为如果没有卡,能想象要做的项目可能就不太一样了。”</p>
第四,AI带来社会冲击。这些冲击包括对民众的冲击、企业的冲击、政府监管的冲击、社会发展的冲击,带来一本正经胡说八道、深度伪造等伦理问题,很多国家开始立法,这需要共同推动治理、向前发展。</p>
第五,智能的本质。人工智能蓬勃发展,但人们对智能的本质并没有清晰认知。“大模型大到一定地步以后就涌现出来。多大才涌现出来?没人讲得清楚。”沈向洋表示,“很多人相信scaling law(规模法则),但今天的深度学习,理论非常欠缺。从宇宙到量子,物理学有一套大一统的理论统一起来,叫作Theory of Everything。今天深度学习没有这样的理论,所以叫作Theory of Anything。”</p>
2.中国工程院邬贺铨院士:《算力十问》</p>
在第二届“华彩杯”算力创新应用大赛启动会上,中国工程院邬贺铨院士发表题为《算力十问》的主旨报告</p>
就超算、通算、智算三类算力是否存在合理比例的问题,邬院士认为,不同地区需求不同,不可能有固定的比例。通常国家与区域创新中心城市对超算有较大需求;机 密性和时延敏感性决定了城市政务数据和重要企业关键数 据尽量在同城通算;东部地区的AI训练任务重、智算比例高;西部算力枢纽也需要增加智算能力,但一般西部地区以配置通算为主。</p>
关于算存比,邬院士强调,存力与算力需配合,避免因存力短缺造成算力等待而影响处理效率。而存力按位于服务器内外分为内存与外存,对于CPU密集型计算任务,影响算力效率与性能的主要是内存,据分析合理的算存比是GFlops/GB为 1;对 I/O 密集计算任务,需频繁访问外存,如何考虑计入外存力的算存比合理取值,值得商榷。邬贺铨同时指出,存力有HDD机械硬盘和SDD固态硬盘之分,后者可节能 70%,但我国SDD仅占24.7%,不及美国一半。</p>