您的位置:首页 >文化 > 正文

训练大模型的数据或在2026年耗尽 数据源头公司深度受益于AI浪潮


(资料图)

超大模型依赖于海量的数据,研究机构Epoch AI认为,对数据需求急剧增加,以至于可用于训练的高质量文本可能会在2026年耗尽。

人工智能模型的两个基本要素就是数据集和处理能力,系统在数据集上接受训练,模型通过处理能力检测这些数据集内外部之间的关系。在某种程度上,这两大基本要素可以相互替代:一个模型可以通过吸收更多数据或增加更多处理能力加以改进。然而,在专业人工智能芯片短缺的情况下,后者正变得越来越困难,这导致模型构建者加倍专注于寻找数据。东北证券分析称,在本轮AI浪潮下,叠加数据要素市场的快速变革,本身是数据源、或接近数据源的公司能够更好地使用AI创造出更大价值,成为AI新时代真正的受益者。

据财联社主题库显示,相关上市公司中:

中文在线拥有海量的正版中文数据资源,公司拥有网络原创驻站作者440余万名,超万亿字的中文文字资源。

中信出版是全国优秀出版机构,拥有图书、报刊、电子、音像和网络出版及批发零售全牌照,主营图书出版与发行、数字阅读与服务业务和书店业务。

标签:

热门资讯

最新图文

资讯播报