首页《可乐在线娱乐挂机欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。PART1动态[国内要闻]1.百度、字节等8
欢迎来到编程客栈的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。
1.百度、字节等8家公司大模型产品正式上线日,百度(文心一言)、字节(云雀大模型)、商汤(日日新大模型)、中科院旗下紫东太初大模型、百川智能(百川大模型)、智谱AI(GLM大模型)、MiniMax(ABAB大模型)、上海人工智能实验室(书生通用大模型)8个企业/机构编程客栈
广东省2家和其他省市1家也将陆续开放。广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。阿里通义千问、360智脑不在首批获批名单中。
百家云在战略发布会上发布了一站式 AIGC 场景化平台「百问大模型」。该平台基于百家云的技术积淀和研发实力,保证企业数据安全的同时,能够低成本接入各类 AIGC 服务,解决企业应用模型技术的困难。该平台提供多种数据安全审计方式,支持零代码快速生成应用,集中管控企业知识库,满足信创要求,并支持私有化部署自主可控。百家云还展示了该平台在智能大模型 AI 客服、公文写作、个人 AI 助理、数字人互动直播和营销文案辅助等场景的应用案例。
360发布2023年半年报,总营收45.03亿元,其中安全业务实现营收9.08亿元。360安全大模型已在360内部及自有产品落地应用,并创造近2000万元相关业务收入。360安全大模型是360自研的认知型通用人工智能大模型,具备多项核心能力,已推出企业级 AI 大模型解决方案,并与合作伙伴推出行业大模型,推动大模型产业发展。
近期微博推出了一项名为 “明星 AI 情感伴聊” 的功能,用户向明星发送私信并授权使用该功能后,专属的 AI 助手将模仿明星的聊天方式和风格进行自动回复,以此提升用户的情感体验。目前该功能仅支持用户发送文本编程
科大讯飞表示,已首批顺利完成备案。首批通过备案的企业名单,预计将在1周内陆续由各地方相关管理部门通知大家。广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批。
嘉楠科技发布了参数量为70亿的通用大语言模型 Toucan-7B 及 INT4量化版本 Toucan-7B-4bit。Toucan-7B 能够实现文案写作、代码解析、信息抽取等多种自然语言处理任务,并在测试中表现优于 ChatGLM-6B。Toucan-7B-4bit 使用了最新的 INT4量化技术,显存占用量更低,与 Toucan-7B-fp16模型相比,具有较好的推理效果。
阿里旗下的 “通义千问” 大模型已完成备案工作,预计将在1周内获得各地相关管理部门的通过。该模型是阿里云推出的一个超大规模的语言模型,具编程客栈
华为开始招募全新小艺众测体验官。首批支持众测的机型包括 Mate60/P60系列。全新小艺能够更好地理解用户并提供更精准的反馈,包括本机数字内容搜索、对话识别屏幕内容、帮助用户快速摘要、文案内容辅助、图片二次创作等功能。用户可在8月31日至9月15日期间通过会员中心体验官用户调研完成提交问卷、报名,众测时间暂定为9-10月。
百度营销推出了一款名为 “品牌 BOT” 的对话式广告新产品,旨在帮助企业与用户建立更深层次和贴心的双向交流通路,提升用户信任感和粘性。品牌 BOT 具有识别用户意图并提供相应回复的能力,能够提高营销效率,降低用户决策成本。
百度智能云宣布将在9月5日举行的2023百度云智大会上,对千帆大模型平台进行大版本升级。此前,百度智能云已向企业客户全面开放文心一言服务,并与300多个合作伙伴在400多个场景中取得了不错的测试效果。
昆仑万维表示,“天工” 大模型自发布后一直以 “周” 为单位进行迭代,训练集群保持高负荷的运行。今年7月,手机端天工 AI 助手正式上线,进入内测阶段,苹果和安卓用户均可下载。目前,“天工” 大模型已经具备强大的自然语言处理和智能交互能力,并展现出更高级的自主学习和智能涌现能力。。
智谱 AI 宣布上线首款生成式 AI 助手「智谱清言」。该助手基于智谱 AI 自主研发的中英双语对线,经过万亿字符的文本与代码预训练,并采用有监督微调技术。「智谱清言」作为智能助手,可解答各类问题、完成各种任务,具备丰富的能力。用户可通过应用商店或微信小程序下载体验。
文章核心内容:美图公司推出 AI 数字人生成工具 DreamAvatar,首期推出了 “AI 演员” 数字人服务。用户只需要将拍摄好的视频素材导入,AI 会进行人体检测、跟踪、擦除、替换等处理,将线D 人体姿态估计和驱动算法,DreamAvatar 的 AI 演员能够与线.生成式人工智能服务内容标识方法公布 AI 生成内容应标注 “AI 生成” 等信息
根据《生成式人工智能服务管理暂行办法》,信安标委发布了《网络安全标准实践指南 —— 生成式人工智能服务内容标识方法》。该指南给出了针对文本、图片、音频和视频四类生成内容的标识方法,要求在内容中添加标识,并在元数据中添加扩展字段。指南还要求在生成内容的显示区域中持续显示提示文字,或在背景中添加显式水印标识。
17.面壁智能发布千亿多模态大模型 “Luca” 面壁露卡 Luca2.0开启公测
商汤集团在2023年上半年加快了生成式人工智能(Generative AI)业务的推进,其中包括大语言模型及文生图模型的研发。他们联合多家国内顶尖科研机构发布了预训练大语言模型 InternLM,并在其基础上推出了生成式 AI 产品系列。这些举措使得生成式 AI 相关收入增长了670.4%,占集团总收入的比例也提升至20.3%。
元,同比增长29.8%。经调整后归属于母公司权益持有人的净利润1.51亿元,同比增长320.4%。AIGC 的推动下,美图公司的 VIP 会员数超过720万,创历史新高。影像与设计产品业务收入、美业解决方案业务收入、广告业务收入都呈现增长趋势。
昆仑万维自研 AI游戏平台 Club Koala 亮相 预计年末正式发行
智己汽车发布了 “智己生成式大模型 Beta 版”,该模型具备自然语言处理和机器学习能力,融合了千亿级参数,可以自动编排和自学习。预计该模型将于10月与智己 LS6车型一起交付并上线。该大模型可以通过多重意图识别,精准理解用户的需求和指令,并根据历史交流偏好和习惯为用户提供个性化、专属的出行体验。
蚂蚁集团将在外滩大会上发布自研大模型的最新落地进展,从模型层到应用层都会有展示。蚂蚁集团副总裁陈文光透露,蚂蚁贞仪大模型目前尚未对外公布,但他强调蚂蚁在大模型技术方面的研发已持续数月,并正在探索和深化对大模型技术的理解和应用。蚂蚁认为自己在业务场景和数据方面具有独特优势,可以在大模型的应用方面取得成果。
谷歌计划在印度和日本市场推广其人工智能驱动的搜索生成体验(SGE)计划,该功能目前仍处于邀请加入的阶段。SGE 旨在为用户提供策划的答案,而不是传统的网页列表。谷歌的系统与微软的不同之处在于,它将人工智能直接整合到现有的搜索栏中。该功能将提供多语言版本和语音输入功能,并在搜索结果页面上继续显示广告。
游戏公司 Activision 宣布将在其旗舰射击游戏《使命召唤》系列中引入人工智能语音聊天审查系统。该系统由人工智能公司 Modulate 研发,名为 ToxMod。ToxMod 系统可以实时识别仇恨言论等违规内容,但最终审核仍由人工客服执行。系统首先在北美试运行,11月全球发布。通过语音转录和情感分析等技术,ToxMod 可以更准确地判断语音中的恶意程度,避免 AI 作出错误判断。
8.超大福利!Runway 启动创意合作伙伴计划:为精选用户提供百万积分奖励
谷歌 DeepMind 推出名为 SynthID 的工具,可以为 AI 生成的图像添加隐形数字水印,从而可靠地识别 AI 生成的图像。SynthID 使用两种深度学习模型,一种用于生成隐形水印,一种用于检测水印。该水印可以抵御常见的图像处理操作,如裁剪和变色。DeepMind 计划首先在 Google Imagen 图像 AI 上使用 SynthID,并有可能将其推广到其他系统上。
谷歌计划向大型企业收取每个用户每月30美元的费用,以使用其为 Gmail 和其他生产力应用程序添加的人工智能增强功能。谷歌的 Duet AI 功能被宣传为谷歌应用程序中的有用协作者,并将与微软的365Copilot 功能采用相同的定价模型。这些费用是除了公司已经支付的生产力套件订阅费用外的额外费用。谷歌表示,目前尚未确定规模较小的组织和个人用户的定价。
在谷歌云 Next23大会上,谷歌推出了多款新品和更新,其中生成式 AI 成为核心主题。谷歌云扩展了云 AI 产品,提供第三方模型,如 Meta 的 Llama2和 Anthropic 的 Claude2。谷歌还宣布 PaLM2升级,支持38种语言和32K 上下文窗口,并扩展了 AI 模型的自定义服务,如 PaLM2支持微调和 Imagen 支持 “风格调优”。
英伟达推出全新的 AI 模型 NVIDIA DLSS3.5,采用光线重建技术,为密集型光追游戏和应用程序提供更高质量的光追图像。该模型实现了三大突破,通过 AI 学习生成更高质量的光线追踪图像,不依赖硬件且支持新老显卡,训练数据增加5倍以保留更多细节。光线重建使用 AI 模型替代多个手动降噪器,能更准确生成光照效果,并与 DLSS 的超分辨率和帧生成技术相结合,大幅提升光追游戏的性能和图像质量。
雅虎宣布在其邮箱服务中测试多项人工智能新功能,包括名为 Shopping Saver 的购物功能,可以在用户的收件箱中检索被遗忘的礼品卡、优惠码和商店积分,并提醒用户使用这些优惠。除了购物功能,雅虎还改进了搜索和撰写助手等其他人工智能功能,帮助用户更方便地搜索旧邮件和选择合适的语气。雅虎利用人工智能提升产品价值,这一策略可能有助于挽救雅虎邮箱用户流失。
美国外卖平台 DoorDash 推出了语音订餐服务,利用人工智能系统接听餐厅的电话订餐,帮助餐厅处理线上外卖订单。该服务可以全天候接听餐厅电话,让餐厅员工专注处理店内顾客和外卖订单。人工智能系统可以根据用户数据做个性化推荐,并提供多种语言支持。服务目前仅面向部分餐厅开放,根据餐厅需求进行调整。
三星计划在9月12日的 RealSummit2023上发布自家研发的生成式 AI 工具,可能命名为 Simply Chat。该工具主要面向三星内部员工使用,旨在提高工作效率,提供编程支持、邮件帮助、文档摘要等功能。预计在10月开始内部测试,如果测试顺利,将在2023年底或2024年初面向所有员工开放使用。
Meta AI 推出了 OCR 神器 Nougat,可以将 PDF 文档转换为 MultiMarkdown,并且能较为准确地转换复杂的数学公式和表格。Nougat 基于 Transformer 模型构建,不需要 OCR 相关输入或模块,能隐式识别文本。为了提高泛化能力,研究团队使用数据增强技术模拟扫描文件的不完美和多变性。
4.全球首个大模型 Agent 产品爆款出场!动动嘴让 PC 成为打工人
实在智能推出了基于大模型的 Agent 产品 TARS-RPA-Agent,也叫 ChatRPA。该产品能理解人类意图,操作所有桌面软件,包括复杂的 CS 架构软件和不开放接口的软件。通过 CV 大模型 ISSUT 的加持,TARS-RPA-Agent 可以像戴上了屏幕洞察眼镜一样,秒懂屏幕上的一切。
7.视觉语言模型 BLIVA: 让 AI 更擅长阅读图像中的文本 懂得看路牌和食品包装
BLIVA 是一种视觉语言模型,擅长读取图像中的文本。BLIVA 结合了 InstructBLIP 的学习查询嵌入和 LLaVA 的编码修补嵌入。BLIVA 在多个数据集上表现优异,可用于识别路牌、食品包装等场景。该模型的双重方法允许同时利用针对文本定制的精炼查询嵌入和更丰富的编码修补,提高了视觉理解的能力。
Bored Humans 是一个拥有100多种免费 AI 工具的网站,可替代许多付费工具。网站包含有趣的 AI 小工具,但生成的图像质量通常不如 Midjourney 等更复杂的模型。该网站由美国域名投资者 Eric Borgos 创立,提供了许多有趣且新颖的免费 AI 小工具,但仍有改进空间。
9.文生图 prompt 不再又臭又长!LLM 增强扩散模型,简单句就能生成高质量图像
纽约大学教授 Yann LeCun 及其团队认为,大型语言模型的智能提升受限于语言本身的局限性。尽管语言模型在常识推理测试中表现出色,但其理解能力仍然肤浅,无法达到类人智能的水平。他们指出,语言模型只能通过学习背景知识和上下文来理解语言,但对于复杂的对话技巧和非语言的知识,模型的记忆力和注意力有限。因此,多模态的学习和非语言的理解能力将是实现线年上半年美国人工智能创业占投资份额四分之一
根据 Crunchbase 数据统计,2023年上半年美国创业投资市场中,超过四分之一的资金流入了人工智能领域的初创企业,环比增
长一倍以上。人工智能正成为资本追捧的新宠,其在融资榜上脱颖而出的关键在于其可广泛应用于各个行业,抵御了其他垂直领域的融资缩水。
Worldcoin 公司的创始人 Saturnin Pugnet 预计,到2030年,人工智能通用人工智能(AGI)和核聚变能源将实现。他的预测与 OpenAI 创始人 Sam Altman 的观点相似。Pugnet 还提到了他发起的 Worldcoin 项目,旨在通过提供全民基本收入来应对 AGI 可能带来的就业减少。4.
微软总裁兼副主席 Brad Smith 在接受采访时表示,人工智能可以被武器化,并需要人类加以控制。他强调,每一项技术发明都有成为工具和武器的潜力,因此我们必须确保人工智能仍然受到人类控制。全球科技领袖也对人工智能的风险发出了警告,并强调减轻这些风险的必要性。此外,人工智能的爆炸性增长也引发了工人对工作被取代的担忧。
计算机科学家对几个大型语言模型在 StackOverflow 的Java编码问题上的回答进行了评估,结果发现这些模型的代码质量仍然不尽如人意。研究发现,GPT-4的 API 误用率达到了62.09%。
Salesforce 最近对来自25个国家的1.4万名企业买家和消费者进行了调查,发现企业在采用人工智能技术的 “竞赛” 中,可能以客户信任为代价。调查显示,虽然客户普遍对 AI 应用持开放态度,但近50% 的受访者不信任企业会合乎道德地使用 AI。调查建议企业提高 AI 使用透明度和结果验证,49% 的受访者希望获得更多选择权,决定 AI 在接触中的应用方式。
生成式 AI 的兴起让硅谷重新焕发活力,吸引大量投资。根据数据显示,今年美国生成式 AI 的风险投资交易总额已达146亿美元,远超过过去两年总和。专家认为生成式 AI 是最具变革性的技术趋势之一。
卡巴斯基公司首席执行官尤金・卡巴斯基在亚太网络安全峰会上表示,ChatGPT 目前可能能够回答一些较为直接和简单的问题,但与人类智能仍存在差距。卡巴斯基的研究团队正在利用 ChatGPT 改进工作流程,但不完全信任其生成的结果。
根据皮尤研究中心的调查,只有18% 的美国人使用过 ChatGPT,实际使用率仍然很低。调查还发现,47% 的人表示对人工智能感到担忧而不是兴奋。ChatGPT 主要用于娱乐和自我教育,而不是工作相关。调查还显示,了解 ChatGPT 的工作人员认为它对他们的工作影响不大。
郭明錤是天风国际的分析师,他表示,ChatGPT 流量的下降对于 AI 供应链的整体股价表现不利。他认为,ChatGPT 的流量下降以及缺乏证明可持续盈利的 AI 服务商业模式,可能会影响到 AI 股票的表现。此外,他还指出,英伟达发布的 L40S 可能会使投资人将对 AI 投资的关注重点转移到 AI 边缘运算上。
随着对人工智能系统的兴趣激增,全球电网可能会面临与比特币相当的巨大能源消耗压力。幸运的是,比特币已经展示了如何减轻能源消耗的方法,为 AI 行业提供了经验。生成式 AI 不具备能源浪费的问题,相比比特币,AI 能够给世界带来更多的价值。目前,AI 训练和部署所消耗的能源还不算巨大,但随着生成式 AI 的发展,能源消耗可能会逐渐增加。
最近的研究发现,ChatGPT 在32门大学课程的测试中,有9门的表现可与学生相比或甚至优于学生。ChatGPT 在数据结构、公共政策概论、定量合成生物学等科目中的表现与人类学生一样好,甚至更好。然而,在数学和经济学任务中,学生的表现优于 ChatGPT。
ChatGPT 是世界上最强大的 AI 之一,可以通过各种考试,并且在某些情况下输出的回答难以辨别真假。然而,在解决简单的视觉逻辑难题方面,ChatGPT 还存在着局限性。一项研究发现,ChatGPT 在某些图案测试中的正确率仅为1/3或3%,这引发了研究人员对如何评估 AI 系统能力的思考。为了提供更好的评价标准,研究人员设计了一系列逻辑谜题,旨在测试 AI 系统的抽象推理能力。然而,目前的结果显示,ChatGPT 在逻辑谜题方面仍然无法接近人类的水平。2.
文章总结:现阶段的搜索 AI 暂时还无法取代传统搜索引擎。虽然一些搜索 AI 产品如天工 AI 搜索在国内引起了轰动,但在实际表现中仍存在幻觉和理解能力的限制。传统搜索引擎在可靠性方面更具优势,而搜索 AI 则注重对晦涩、复杂内容的解读。未来的搜索引擎可能会结合传统搜索和 AI 搜索的优势,通过智能处理和提炼信息,为用户提供有价值的思路和建议。
OpenAI 预计在未来12个月内,通过销售人工智能软件及其计算能力,将获得超过10亿美元的收入。OpenAI 已经开始商业化,并推出了 ChatGPT 的订阅收费模式和企业版,以提高用户付费比例。然而,OpenAI 的高成本仍然是一个挑战,包括人才成本、训练成本、推理运营成本等。与此同时,OpenAI 与微软之间的关系也变得复杂,微软在 OpenAI 投资了100亿美元,但两者在商业化进程中的利益冲突也开始显现。
随着人工智能图像技术的进步,辨别真实图片和 AI 生成图片变得越来越困难。文章介绍了几种方法来评估图像,提高识别 AI 生成内容的能力。首先是反向图像搜索,查看图片的来源是否可信;其次是放大检查图像,查看像素、轮廓等细节问题;然后是检查人物是否过于完美,缺乏真实的皮肤纹理;还有比较不同区域,检查是否存在不一致之处;最后是检查背景是否模糊、缺少细节。
AI 工具在电商领域中的应用越来越显眼,能够帮助商家快速、低成本地生成商品图。这类 AI 工具通过简单的操作,可以快速生成多种风格的商品场景图,效率大大提高。不需要设计经验的商家也能通过 AI 工具获得符合需求的商品图。AI 生成的商品图更像是围绕一件商品提供的完整场景融合方案。
AIGC(生成式人工智能)正在对新闻业产生重大影响。传统新闻业面临流量逻辑变迁、短视频冲击、线上广告收入萎缩等挑战,而 AIGC 的出现给新闻业带来了新的可能。AIGC 技术的发展与大模型技术密切相关,大模型作为 AIGC 的基石,为新闻生产提供了更高效、多样化的方式。AIGC 的应用范围涵盖自动化报道、舆情分析、内容优化等多个环节,并具备多模态内容生成能力。7. AI 数字人,先卷死二流带货主播
数字人的技术逐渐成熟并普及,首先在电商领域造成冲击,二流带货主播面临失业。虚拟数字人的出现解决了小商家带货主播稳定性差、直播成本高的问题。数字人可以根据预设的文案自动生成带货视频,成为小商家的心头好。然而,数字人行业发展不平衡,服务质量参差不齐,存在版权归属问题和虚假信息传播风险。同时,数字人的出现也引发了关于人工智能生成内容的平台规范和版权争议。
大模型在吟诗作画,我们在苦哈哈干活。AI 大模型迫切需要真实的可落地场景释放价值。电商场景中的大模型已经走在落地之路上,重构相关业态,特别是在生成式内容方面。智能客服是 AIGC 在电商领域落地的急先锋,因为它可以提高客服的人效,减少成本。
文章讲述了一个大模型数据标注员丁洋的故事,他在海口从事给文心一言做标注的工作,每月能拿到4000元的薪资。文章介绍了大模型数据标注员的工作内容和薪资待遇,以及人工智能对于数据标注的重要性。
文章概述了抖音、快手、小红书、B站四大内容平台在人工智能领域的探索与布局。抖音借AI绘画效果走红,推出剪映AI辅助视频剪辑。快手研发大模型快意,在App上新增AI对话功能。小红书开发AI绘画工具,后又推出一键生成笔记配图的此刻功能。B站正在内测搜索AI助手,可智能归纳视频内容。内容平台均在利用AI来辅助内容创作,提供更多玩法,以吸引更多创作者。
本文介绍了大模型 AI 工具在三四线城市年轻人中的应用与探索,包括小商家利用 AI 工具降低时间和成本,学生党使用 AI 工具辅助写作和研究,以及 AI 工具在邮件写作和图书创作中的应用。同时,文章也指出了 AI 工具在学术研究中的局限性和需要正确使用的问题。
科学家团队提出了评估人工智能是否具有自主意识的标准清单,通过匹配系统功能来判断是否具有意识。该清单还可应用于现有人工智能系统。然而,目前还没有任何证据表明现有的人工智能系统具有意识。科学家呼吁人工智能公司更加重视意识评估,并制定相应计划。
英伟达通过成为从芯片、软件到其他服务的一站式人工智能开发商,确立了自己的主导地位。他们生产能够执行复杂 AI 任务的芯片,并开发了关键的软件,从而在 AI 芯片制造领域取得领先地位。英伟达还为客户提供专业计算机、计算服务和其他工具,成为人工智能开发的一站式供应商。目前,英伟达占据了人工智能芯片销售额的70% 以上,并在训练生成式人工智能模型方面占据更大的市场份额。
声明:凡注明本站原创的所有文字图片等资料,版权均属编程客栈所有,欢迎转载,但务请注明出处。
图灵测试已死!ChatGPT通过人类考试也不算,超强AI评估新秀「逻辑谜题」
高通展示汽车内类似 ChatGPT 的助手功能 希望在汽车芯片市场获得更大份额
12项性能位居第一,中国最接近GPT-4的大模型来了!现已全面开放服务!
AI视野:北京首批5款AI大模型产品正式开放;文心一言登顶Apple Store免费推荐榜
vivo OriginOS 4.0 暂定 10 月发布 内置AI大模型
文生图prompt不再又臭又长!LLM增强扩散模型,简单句就能生成高质量图像|ACM MM23
解决idea 中 SpringBoot 点击运行没反应按钮成灰色的问题
谷歌 Recorder 应用或加入人工智能与 Pixel 8 系列一同亮相
springboot的EnvironmentPostProcessor接口方法源码解析
半年了 华为Mate X3依然供不应求:第三方渠道把价格干到了将近2万元
每周AI大事件 首批国产大模型上线、企业版ChatGPT发布、生成式AI内容标识方法公布
编程客栈为广大编程爱好者、程序员提供专业且权威的编程教程,是您学习软件编程、网络编程、数据库、操作系统、程序设计、脚本、网页制作、建站技术、网站技巧、网络知识技术、CMS教程等必备网站,我们希望成为您心中理想的编程学习网站。