2024年10月22日,以“前沿发明,引颈AI产业新变革”为主题的“2024百度十大科技前沿发明”发布会在北京召开。在本年的十大前沿发明中,大模子已成为产业创新息争锁新质分娩力的进攻持手,AI原生应用正在融入分娩生涯的方方面面。北京市学问产权局副局长潘新胜、百度首席时间官(CTO)王海峰等出席典礼并为发布会致辞。
百度首席时间官(CTO)王海峰暗示,前沿发明不仅救济百度升迁了自有居品、业务效果和效率,也为百度居品AI原生化重构,为东说念主工智能赋能千行百业孝顺了力量。百度发布十大发明,一方面,通过犒赏这些引颈产业创新的前沿效率,饱读动更多的创新创造;另一方面,推动产业界更多应用这些效率,加速产业化程度。早在2017年,百度就运转探索和护士大模子时间,并进一步冲破基于念念考模子的智能体时间,拓展了大模子的智商畛域,促进大模子应用爆发。
北京市学问产权局副局长潘新胜指出,频年来,国度高度爱好东说念主工智能产业发展,北京市正在鼎力推动东说念主工智能创新策源地和产业高地开荒。市学问产权局鼎力救济以百度公司为代表的产业学问产权龙头企业,在重心领域开展产业学问产权促进中心开荒,以学问产权为纽带带动重心产业强链增效。手脚东说念主工智能领域最初企业,百度创新时间和学问产权责任也曾走在了宇宙的前线。但愿百度以这次发布会为机会,接续加强科技创新,以东说念主工智能时间加速赋能产业高质地发展。
现如今,东说念主工智能与实体经济加速会通,我国完备的产业体系为东说念主工智能时间提供了广大应用舞台,推动产业转型升级,成为科技改造和产业变革的要道力量。2024年两会建议“东说念主工智能+”战术,强调AI在数字经济中的进攻性,加速完了高水平科技自立自立。百度手脚最初科技企业,积极推动时间限制化落地,加强自主创新,在城市、交通、工业、金融等领域取得显赫效率,为科技强国和产业强国目的孝顺力量。AI产业正处奇点,时间红利将开释,时间发展也将为各行业转型注入新能源。
百度集团专利事务部总司理崔玲玲发布“2024百度十大科技前沿发明”:百度发布这些前沿发明效率,不仅是对百度时间创新智商的积蓄展示,更是对改日东说念主工智能发展趋势的深切知悉。百度东说念主工智能领域的前沿专利发明,涵盖了从基础算法到应用场景的全场合冲破,正引颈着AI产业新的变革,咱们但愿陆续加速专利时间的产业化程度,以此推动千行万业的智能化升级,从而促进经济高质地和可持续的发展。
自2013年入局AI领域,百度一直维持压强式、马拉松式的研发干涉,近十年累计研发干涉近1700亿元。据国度工业信息安全发展护士中心、工信部电子学问产权中心本年4月份发布的《新一代东说念主工智能专利时间分析论说》流露,按捺2023年底,百度在东说念主工智能全领域专利央求量19308件、授权量9260件,颐养六年位居国内第一;在以大模子为中枢的新一代AI领域,百度专利央求1432件、授权651件,成为时间创新和专利布局领军者。字据专利数据库机构IFIclaims发布的生成式东说念主工智能专利图景知悉,百度生成式东说念主工智能专利央求量踏进寰球TOP10,是独一进入该榜单的中国创新主体,况兼专利时间涵盖文本、图像、语音、视频四大基础领域,成为这四个领域全面布局的寰球四家公司之一。百度在东说念主工智能及大模子时间领域的最初地位和超卓专利布局收获的取得,离不开其对AI时间长久持续的干涉和专注。
11月12日,以“应用来了(Applications Are Here)”为主题的百度世界2024行将在上海举办。手脚一年中备受耀眼的科技发布会,百度也将发布最新效率,再次带来令东说念主耀眼的时间冲破和居品发布。同期,百度也将通过持续的研发干涉和时间创新,陆续加强数智产业的快速发展,为经济高质地增长带来更多动能。
百度2024十大科技前沿发明,具体如下:
一、基于生成式大模子的智能体时间
该发明时间创新性地引入了念念考模子,使智能体具备了任务研究、器用调用、学问增强和反念念进化等多重智商。通过系统化的瞎想与中枢智商的定向优化,能够低资腹地救济不同应用场景下智能体的限制化开荒与部署;通过开荒大规效法真智商,加速智能体构建与分发。该时间系统已生效应用于文心智能体平台、商家智能体、文心快码等多个重心场景,显赫升迁了智能体的研发效率,裁汰了研发门槛。其中,商家智能体通过研究+巨匠的多模子协同时间和大规效法真时间,升迁反念念、进化和使用器用的智商,构建AI营销智商;文心快码依托代码保举和智能体系统,与传统DevOps器用链有机结合,推动东说念主机协同结对编程的深度探索与落地。
二、基于大模子高效践诺框架的多模子协同进化时间
该发明时间从工程和算法两个角度攻克系列难题。工程架构上,从搀和并行策略、通讯效率、狡计存储优化全场合创新冲破,显赫升迁大谈话模子践诺性能,赞助文心全系列模子全经由高效领会践诺。算法策略上,研发了大小模子协同的预践诺时间,攻克了模子间学问难以领受的时间难题,改变了传统模子的践诺范式,裁汰了新模子践诺资本。基于该发明构建了各限制模子的时间壁垒,使文心大模子践诺混沌速率在曩昔一年升迁了4.1倍,救济文心一言高效郁勃不同需求的无为业务,赋能千行万业。
三、基于大模子和学问检索增强时间的多模态本色创编一体的智能系统
本发明时间概括欺诈学问增强、多源本色解析、会通式剪辑、检索增强文生图等时间,治理了专科长文及多模态本色生成质地弱、创编无法分享容器、文生图主体准确性差等问题。检索增强文生图,旨在通过智能判断用户需求自适合处理参考图,进而基于搀和模态的生图系统显赫升迁了生图主体的一致性,灵验弥补长尾本色描述不准确的短板,举座效果远远进步文生图原生系统。百度文库也曾在基于用户领导及上传本色及时生成行业研报、演示文稿、念念维导图、画本漫画并救济一站式剪辑、跨模态调理、通用/个性化生图等复杂任务方面取得了显赫的效果升迁。2024年8月,极光旗下月狐数据发布论说流露,百度文库智能PPT阛阓份额已达能够,近3月用户限制复合增速达23%,增速远超行业水平。
四、救济限制化的自动驾驶定位和车说念级舆图生成时间
该发明时间冲破了传统样式的效率和资本问题,裁汰了舆图制图资本95%,车说念级说念路里程进步360万公里,完了宇宙进步41000个城州里说念路的全覆盖。基于舆图数据进一步构建的多模态传感器会通的自动驾驶高精定位时间,精度达到厘米级,极大提高了可量产性,将车端定位依赖的舆图包体积裁汰97.5%,可靠性达到99.9999%,全面赞助当今萝卜快跑全无东说念主驾驶的限制化运营,在高架桥下、多层路、患难之交等各样复杂繁难场景完了全无东说念主驾驶。
五、面向大模子智能化的个性化挂牵机制
该发明时间创新性地建议了一套全面的挂牵机制,涵盖挂牵加工、存储、握住、触发和利用五大模块,赋予大模子个性化挂牵智商。挂牵加工模仿东说念主类海马体机制,完了了对全场景用户信息的深度领会和精确加工;挂牵握住救济用户主动与系统自动的增改削查,确保了挂牵库的及时更新与准确;挂牵触发和利用,通过关联挂牵的估量生成,辅助大模子产生愈加拟东说念主和个性化的恢复。该发明时间已无为应用于智能AI助手、数字东说念主等场景。
六、基于大模子的超拟真数字东说念主建模、驱动与生成系统
该发明时间建议了一整套的超拟真数字东说念主建模、驱动和生成决策。针对真东说念主数字东说念主,研发了数据驱动的东说念主像建模、跨模态驱动和东说念主像视频生成大模子,完了了当然、拟确凿数字东说念主本色分娩,独家救济大幅动作&狡饰场景的直播东说念主像克隆,并完了了首个全身智能驱动直播间落地。针对超写实3D数字东说念主,基于文心大模子研发了模态迁徙和多智能体衔尾时间,完了了分钟级制作忘形影视大片、3A游戏的超写实数字东说念主形象及运营本色。本发明时间已无为地应用于数字东说念主直播、视频分娩、智能体等盛大真东说念主和3D数字东说念主的居品中。
七、基于大模子的生成式买卖检索系统
该发明时间变革了传统的 “索引-调回-排序”经由,扁平化系统漏斗,减少信息失掉,通过构建索引学习任务,将买卖信息编码进模子参数,完了“模子即索引”,利用大模子的领会和推明智商,完了“生成即检索”,新范式显赫升迁系统定向效率120%。该发明所波及姿色业界率先落地,完了大限制工业化应用,生成式大模子结合买卖搜索场景取得多项时间创新,创意丰富度升迁37倍,创意质地升迁92%,取得了显赫的业务收益和无为时间影响力。
八、大模子数据飞轮时间
该发明时间通过整合用户响应、实行响应和自监督响应等多开头和体式的信息,自动识别模子残障并高效合成高质地、各样化的践诺数据。同期结合多源响应的强化学习法子,显赫升迁了模子践诺效果。该创新时间构建了一个能够持续自我校正的数据飞轮,灵验冲破了大模子的数据瓶颈,裁汰了数据获取资本,提高了大模子的适合性和鲁棒性,升迁了模子在不同任务场景下的泛化智商,加速大模子持续进化。
九、大模子高效推理时间
该发明时间建议的高效推理时间,底层模子层基于飞桨框架,在推理架构想法,结合主流的PrefixCaching、Lookahead、PagedAttention、PD离别等想法持续创新,并将各项时间高效结合,大幅升迁模子混沌和性能。在大模子压缩方面,取舍大模子无损量化时间,通过激活自适合分段平滑与权重联动重排等法子,在业内率先完了了对百亿千亿级大模子的高效无损压缩。该发明救济多种大模子压缩和推理加速技能,当今已应用于百度智能云千帆大模子平台等中枢业务,减少模子推理的资源破费,检朴大模子部署资本超50%,升迁模子性能,模子混沌升迁3-5倍。
十、用户数据响应驱动的检索生成系统
该发明时间建议的检索生成系统,能够结合用户举止响应信号,完了快速自我强化。通过悦目度建模和强化学习平直对皆用户偏好,并利用用户响应触发系统快速反念念,治理了传统数据应用时巨匠响应效率低和用户偏好建模难的问题。基于该框架的检索生成系统已覆盖18%的搜索流量,无为应用于翰墨、视频、图片等搜索场景。多元用户响应的限制大、可轮回的特质,使系统能够快速适合数据、居品和环境的变化,匡助系统自动化寻优,加速系统向梦想现象演进,具备极高的实用价值和阛阓竞争力。