持续攻坚大模型安全技术,蚂蚁集团清华大_蚂蚁的种类

北京最好白癜风医院 https://jbk.39.net/yiyuanzaixian/bjzkbdfyy/zdxbdf/
7月5日，在世界人工智能大会“迈向AGI：大模型焕新与产业赋能论坛”上，蚂蚁集团联合清华大学发布大模型安全一体化解决方案“蚁天鉴”2.0版。蚁天鉴2.0新增AI鉴真功能，支持图像、视频等多模态内容真实性及深度伪造检测；并在测评功能上持续升级，打造了大模型安全测评“智能体”，并新增大模型X光、大模型基础设施测评两大测评功能。至此，蚁天鉴2.0形成了包括大模型基础设施测评、大模型X光测评、应用安全测评、AIGC滥用检测、证件伪造检测、围栏防御等在内的完整技术链条，面向行业提供全方位智能化的大模型安全测评和防御解决方案。(图：蚂蚁集团联合清华大学发布“蚁天鉴2.0”)蚂蚁集团副总裁、大安全技术部总裁李俊奎现场发布了这一升级产品，并介绍道，大模型和Agent智能体正带给我们前所未见的智能体验，同时也带来了模型内部幻觉、安全漏洞和深度生成内容滥用等新的挑战。蚁天鉴旨在打造AI大模型的安全铠甲，确保大模型技术在安全可靠的环境中发挥效能。记者从现场了解到，蚁天鉴2.0有两大特色，一是在测评端研发了业内首个“测评智能体”。该测评智能体提供全流程自动化的安全测评工具，支持各种形式模型和深度学习框架，可扩展测评垂类大模型、多模态大模型及Agent智能体，并能根据被测大模型的安全水位动态调整攻击策略和出具测试用例，保障测评效果和效率。目前，蚁天鉴2.0有超万高质量测评题库，支持最高50万/日的饱和式攻击和逐级诱导深度攻击，并实现了1工作日内完成测评，全流程自动化率＞99%。与此同时，该智能体也增加了两项新功能。一是“大模型X-ray”。即大模型X光，可针对大模型的内在神经元进行X光扫描来做探查和判断，让研究人员了解大模型内部在发生什么、定位可能引发风险的神经元、并进行编辑修正，从而在模型内部治理幻觉，实现从源头识别和抑制风险。二是“大模型基础设施测评”。此前蚁天鉴的测评能力主要集中于大模型生成的内容安全、合规风险等检测。蚁天鉴2.0从攻击者全链路视角出发，深入扫描模型算法组件及软件系统，可及时准确发现大模型供应链及运行环境安全问题，保障云到端的应用安全可控。同时，蚁天鉴2.0防御端新增“AI鉴真”功能。支持多模态内容真实性及深度伪造检测，可快速精准鉴别图像、视频、音频、文本内容的真伪，图像识别准确率99.9%达到行业最高优秀级(信通院测评)。目前，蚁天鉴2.0依托生成模型自建百万量级音视图多模态合成数据集，覆盖主流生成方案，有效应对AI换脸、声音模拟、证件伪造等各类深度伪造风险场景。(图：蚁天鉴2.0大模型安全一体化解决方案全景图)据了解，蚂蚁集团是国内较早布局大模型安全的厂商。蚁天鉴去年7月首次对外发布，1.0版本即被评为年世界人工智能大会“镇馆之宝”。历时1年升级到2.0版，蚁天鉴2.0构建了双重防御护栏，内置防护

转载请注明地址:http://www.mayiox.com/ggjj/13405.html

上一篇文章：蚂蚁被罚71亿,背后真相揭秘

下一篇文章：没有了

最新文章

热点文章

推荐文章