【资料图】

整理|吴莹

让我们一起来回顾一下吧。腾讯混元大模型正式亮相;OpenAI首届开发者大会定档11月6日;苹果扩大AI预算;三星已注册Samsung Gauss商标;百川智能开源Baichuan2大模型;传Meta大模型团队多人已离职;李彦宏:卷大模型没意义,卷应用机会更大;蚂蚁、阿里云、作业帮最新大模型动态……让我们一起来回顾一下吧。

9月7日,在2023腾讯全球数字生态大会上,腾讯全链路自主研发的通用大语言模型——“混元”正式面向产业亮相,并通过腾讯云对外开放。

目前,混元大模型已经接入腾讯50多个业务,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品。据介绍,混元大模型将作为腾讯云MaaS服务的底座,客户不仅可以直接通过API调用混元,也可以将混元作为基底模型,为不同产业场景构建专属应用。9月6日,微信上线“腾讯混元助手”小程序,腾讯混元大模型多模态对话Bot产品,可以回答各类问题,也能处理多种任务,目前仅限受邀用户使用。当地时间9月6日,OpenAI于官网宣布将于11月6日在旧金山举办首届开发者大会OpenAI DevDay。活动为期一天,OpenAI团队将展示其新工具,并与来自世界各地的数百名开发者进行交流,与会者还可以参加由OpenAI技术人员主持的分组会议。

据The Information报道,知情人士透露,苹果一直在扩大用于构建人工智能的算力预算,每天达到数百万美元,其目标之一是开发一些允许用户使用简单的语音命令自动完成多个步骤的任务的功能。据称,苹果人工智能部门负责人John Giannandrea在四年前授权组建一个团队开发对话式人工智能,该团队名为Foundational Models,由几位谷歌前工程师组成,目前约有16人。此外,苹果至少还有另外两个相对较新的团队开发语言或图像模型,一个致力于开发生成图像、视频或3D场景的软件,另一个正在进行多模态相关的研究。

9月3日消息,韩联社发现,三星已经在韩国知识产权局注册了“Samsung Gauss”商标,称其为三星即将推出的生成式人工智能平台的正式名称。

三星电子表示,“三星电子可将 Samsung Gauss 用于人工智能软件、基于机器学习的语言和语音处理计算机软件、人工制作语音、文本、图像、声音和视频的计算机软件以及自然语言处理、生成、理解和分析计算机软件等指定产品。”根据三星电子记载的内容类推,“三星高斯”可能是三星电子正在准备的生成型人工智能相关专利。

9月4日,三星电子家用电器部门副总裁Miyoung Yu在IFA2023展会上宣布,三星电子明年将在所有家用电器中引入基于Bixby的生成式AI功能。如果计划顺利,三星电子家用电器预计不仅会在Bespoke等高端产品线中采用AI服务,还会在入门产品线中应用和实施。

9月6日,百川智能宣布开源大模型Baichuan2 70亿和130亿参数规模的两个版本。相比上一代Baichuan,Baichuan2在文科理科能力方面得到了全面提升,其中数学能力提升49%,代码能力提升46%、安全能力提升37%、逻辑推理能力提升25%、语义理解能力提升15%。

据百川智能创始人、CEO王小川透露,Baichuan在开源社区总下载量已经接近500万次,月下载量达到300多万次。目前百川智能今年三季度发布超500亿参数规模的模型、四季度发布对标的模型、明年一季度发布超级应用的计划执行节奏顺利。据外媒The Information报道,Meta公司发布的Llama和Llama 2大模型在全球风靡,但背后的研发团队并不好过。今年2月发表的Llama研究论文的14位作者,有一半以上已经离开了该公司,其中几位进入了AI初创公司或其他大公司。比如离开Meta的研发人员提莫萨姆·拉克鲁瓦(Timothée Lacroix)、纪尧姆·兰普尔(Guillaume Lample)和玛丽-安妮·拉肖(Marie-Anne Lachaux),他们都是Llama论文的作者,现在都在法国初创公司Mistral AI工作,该公司于今年6月创立。阿尔芒·乔琳(Armand Joulin)是Llama作者兼FAIR的研究主管,他在5月份离开Meta,之后加入了苹果。消息人士称Meta大模型团队内乱严重,此前Llama团队与其他兄弟研发团队因计算资源等争夺产生了激烈内斗,这可能是研发人员离职的一大原因。9月5日,在2023百度云智大会上,百度创始人、董事长兼首席执行官李彦宏表示,模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义,对于创业者来说,“卷大模型没有意义,卷应用机会更大”;AI原生应用要能解决过去解决不了、解决不好的问题,应用才是大模型存在的意义。他认为,AI原生应用应该满足三个基础条件:一是能够用自然语言交互,二是充分利用大语言模型的理解、生成、推理、记忆等能力,三是每个应用的交互不超过两级菜单,所以交互会更简单。

9月7日,在2023inclusion外滩大会上,蚂蚁集团正式开源图学习系统AntGraphLearning(AGL),这是行业首个通用的工业图学习系统,目前实现了万亿规模图数据上的信息协同和结构感知。

9月6日,阿里云推出全新视频生成大模型I2VGen-XL,并在魔搭社区开放体验,用户上传一张图片后2分钟左右可生成一段1280x720分辨率的视频,该模型研发负责人表示,未来将进一步实现2K超清效果,可应用于短视频内容生产、电影制作等场景。

9月2日,作业帮正式发布自研银河大模型。该模型融合了作业帮多年的AI算法和教育数据积累,是一款覆盖多学科、多学段、多场景的教育大模型,具备多学科知识解答、创意写作、自主提问、陪伴式辅导等功能。在测评基准上,该模型以平均分分居C-Eval榜首,同时在CMMLU榜单Five-shot和Zero-shot测评中分别以平均分分及分位列第一。。END 。值班编辑:王怡洁  审校:张格格  制作:董斌

推荐内容