5月21日,阿里云抛出重磅“炸弹”:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。
Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1000万字。
此番降价意味着,1块钱可以买到200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1000万tokens长文本输入,降价后约为GPT-4价格的1/400,击穿全球底价。
图源:网络
同日,百度智能云官宣,文心大模型的两大主力模型ERNIE Speed和ERNIE Lite全面免费,立即生效。
据了解,这两款轻量级大模型分别于今年3月推出,支持8K和128k的上下文长度,免费提供给用户使用,进一步降低了AI技术的门槛。
图源:“百度智能云”推文截图
生成式AI行业技术图谱
生成式AI(GenAI)是计算机科学的一个分支,涉及无监督和半监督算法,使计算机能够使用之前创建的内容(如文本、音频、视频、图像和代码)来创建新内容,以响应简短的提示问题。AI大模型为生成式AI提供了技术基础和能力,而生成式AI则展示了大模型在实际应用中的潜在价值。
生成式AI进入探索爆发期,某些细分技术经过爆发开始走向落地,某些细分技术还处于培育期有待挖掘潜力。生成式AI技术图谱主要评估了当前市场上技术的成熟度与发展潜力。从下到上,代表当前采用度越高;从左到右的3条曲线,代表当前对于整体市场规模的影响。一定程度上,左侧曲线当前的渗透率较高,右侧的曲线未来的增长潜力更高。
技术图谱展示了三种类型的技术,其中变革性技术将彻底重塑市场和投资战略,可能创造新的业务和市场机会,并为企业和消费者市场带来新能力。递增性技术在现有技术的基础上进行了重大改进,以提供更好的业务结果。机会性技术将根据具体的使用情况而发展,其改进现有技术/流程的能力尚未确定或有限。
大模型的应用已经不局限于NLP(自然语言处理) 领域
目前大模型的应用已经不局限于NLP(自然语言处理)领域,包括图片、语音、视频、代码等多种模态的应用开始涌现,而大模型、生成算法与多模态等底层技术的突破成为了生成式AI的质变的关键。一方面,目前大模型可以广泛适用于各类下游任务,当前已经成为了生成式AI的底层框架。许多跨领域的AI应用均是构建于大模型之上,能够解决多任务、多场景、多功能需求,支撑各种模态的生成;另一方面,包括生成对抗网络(GAN)、变分自编码器(VAE)、扩散模型(DiffusionModel)、神经辐射场(Nerf)等快速涌现的生成算法,以大模型为基础,能够创造出文字、图片、语音、视频、代码等各种模态的内容,而基于此之上的多模态应用开始涌现。此外,超级深度学习近年来的快速发展带来了深度神经网络技术在大模型和多模态两个方向上的不断突破,并为AIGC技术能力的升级提供了强力的支撑和全新的可能性。
中国生成式AI行业产品布局
当前主流的生成式AI产品及大模型有百度的文心一言、科大讯飞的星火大模型、腾讯的混元大模型、盘古大模型、华为的盘古大模型等,各家头部科技企业研发打造自己的大模型及生成式AI产品,以达到或超越OpenAI推出的GPT-4生成式AI产品。
面对行业内“愈演愈烈”的价格战,2024年5月21日,零一万物CEO李开复在采访中认为,在一定程度上,整个行业每年降低10倍推理成本,这是可以期待的,而且是必然也应该发生的。“今天可能是处在一个比较低的点,但是我觉得如果说以后大约有一年降价10倍来看的话,这是一个好消息,对整个行业都是好消息。”
当前行业内还存在诸多乱象,中山大学-善思开悟AI创新赋能联合实验室执行主任韦立坚指出,当前我国AI大模型发展面临着自主研发能力不足、训练数据原料不足、算力短缺等3个方面的挑战,其提出4个建议:一是加强基础研究与产学研合作;二是企业间联合研发,打通语料数据;三是实现算力统管、纳管,统一调度,智算和超算融合,弥补大模型算力不足;四是加强国产通用GPU研发,应对国家层面的技术安全和经济安全所面临的挑战。
展望行业未来发展,金山办公安全中心负责人刘振全呼吁各个行业联手合作,共同解决大模型安全问题、道德伦理问题,推动我国人工智能的可持续发展。
前瞻经济学人APP资讯组
更多本行业研究分析详见前瞻产业研究院《中国AIGC产业发展前景预测与投资战略规划分析报告》
同时前瞻产业研究院还提供产业大数据、产业研究报告、产业规划、园区规划、产业招商、产业图谱、智慧招商系统、行业地位证明、IPO咨询/募投可研、专精特新小巨人申报等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。
更多企业数据、企业资讯、企业发展情况尽在【企查猫APP】,性价比最高功能最全的企业查询平台。