
上QQ阅读APP看书,第一时间看更新
1.3 百花齐放——大模型发展现状
目前,国内外大模型百花齐放,各个公司和研究机构都在研发私有大模型。其中,谷歌、OpenAI、Meta和微软等国外头部公司之间存在竞争和合作,不断创新模型结构和训练方法;而国内的百度、华为、阿里巴巴等公司则呈现追赶之势,在模型参数量上毫不逊色,也有一些特色和创新。图1-12展示了国内外的主流大模型[1]。
大模型不仅在科学研究上取得了一些成果,在实际应用上也展现了价值和影响。例如,在教育领域,大模型可以作为智能辅导员或教师助理,提供个性化的学习内容和反馈;在娱乐领域,大模型可以作为智能创作伙伴或演员替身,生成文学、音乐、影视等作品;在商业领域,大模型可以作为智能营销人员或客服代表,提供定制化的服务。

图1-12 国内外主流大模型
目前国内人工智能市场发展迅速,各大科技企业纷纷入局人工智能大模型,构建“模型+工具平台+生态”的三层体系。头部企业均采取这种共建模式,不仅有助于业务的良性循环,而且也更容易借助长期积累来形成竞争壁垒。目前,百度、腾讯、阿里巴巴、商汤科技、华为等国内大模型厂商,北京智源人工智能研究院、中国科学院自动化研究所等研究机构和英伟达等芯片厂商也纷纷入局。国内大模型不断创新和突破,不断刷新各项任务的最新技术水平(state of the art,SOTA)。例如,百度的大模型ERNIE 3.0这一基于知识增强的多范式统一预训练框架,曾在CLUE 1.1总排行榜排名第一;腾讯的万亿参数级别中文自然语言处理预训练模型HunYuan-NLP,曾在CLUE 2.0总排行榜排名第一;阿里巴巴的万亿参数级别大模型M6在WMT21新闻翻译任务中,刷新了英文到中文和中文到英文两个方向的最新技术水平。国内部份大模型如表1-2所示。
表1-2 国内部份大模型
