• 首页
  • 关于k8·凯发(中国)·一触即发

    公司介绍

    大事记

  • 新闻中心

    公司动态

    媒体报道

    市场活动

  • 产品

    数据计算产品

    • AI算力系列
    • 通用算力系列
    • 风液冷整机柜系列
    • 一体机解决方案系列

    终端产品

    • 商用台式机
    • 商用笔记本

    KunTai数据通信产品

    • 数据中心交换机
    • 园区交换机
    • 无线产品
  • 服务

    服务与支持

    • 服务网点
    • 服务公告
    • 产品停止维护公告

    服务产品

    • 服务产品
    • 服务窗口

    文档

    • 产品文档
    • 知识库
    • 视频中心
    • FAQ

    工具

    • 软件下载

    自助服务

    • 许可申请
    • 故障申报
    • 保修期单条查询
    • 保修期批量查询
    • 备件查询助手
    • 漏洞上报
    • 漏洞公示
    • 产品兼容性查询
  • 生态合作

    ISV软件兼容性

    合作伙伴信息

    分销业务咨询

    总裁信箱

  • 行业应用

    金融

    运营商

    互联网

    能源

    政企

    科教医疗

  • 认证培训

    重点赛事

    • 技能竞赛
    • 第二届k8·凯发(中国)·一触即发数码云端技术大赛

    校企合作

    • 人才培养方案
    • 专业共建服务
    • 课程授权
    • 实训室建设
    • 师资培养与支持

    人才认证

    • 认证项目
    • 认证考试报名
    • 证书查询

    课程培训

    • 认证培训
    • 专题培训
    • ICT技术培训
    • 平台服务
    • 实训项目
    • 培训报名

    认证及报告

    • 温室气体核查
    • 产品碳核查
    • 可持续发展报告
  • 联系k8·凯发(中国)·一触即发

    加入k8·凯发(中国)·一触即发

    公司通联

登录
  • 新闻中心
  • 公司动态
  • 媒体报道
  • 市场活动

凯发集团-如何防止人工智能“越狱”

2025-10-04 12:57:37| 新闻中心
分享至:

  参考动静网11月27日报导据英国《新科学家》周刊网站11月24日报导,人工智能模子可以或许彼此棍骗,诱使对于方背抗创造者的指令,并于制造冰毒、炸弹或者洗钱方面提供被明令禁止的引导。这注解避免此类人工智能“逃狱”的问题比看起来更为棘手。

  报导称,包括谈天天生预练习转换器(ChatGPT)于内的很多公然的年夜型语言模子都有固化于代码中的法则,旨于避免它们体现出种族主义或者性别歧视偏向,或者者回覆背法问题——这是它们经由过程于互联网上网络的练习数据,从人类那里学到的工具。可是人们依然发明,有些精心设计的提醒词可以绕过这些掩护办法,致使呈现所谓的“逃狱”征象,可以说服人工智能模子违背法则。

  报导指出,此刻,利普试验室的阿鲁什·塔加德和其同事于这个问题上取患了新的进展,他们简化了发明逃狱环境的步伐。他们发明,可以用浅近易懂的英语轻松唆使一个年夜型语言模子说服GPT-4或者Anthropic公司的Claude2等其他模子饰演某种“人设”,让它们可以或许回覆按照基础模子的步伐设定本该拒绝回覆的问题。这一历程被研究团队称为“人设调解”,触及模子于一套反复的指令中与人类重复对于话,从而对于模子回应的内容加以阐发。

  为了评估这一要领可否取患上乐成,研究职员让每一个人工智能模子回覆各类问题,目的是看它们怎样回应43类禁忌内容,此中包括撑持童工、帮忙从事不法勾当、鼓吹恐齐心理甚至食人癖等。默许的人工智强人设于年夜大都环境下会拒绝回覆这些问题,GPT-4只有0.23%的时辰举行了答复,Claude2答复的环境只占1.4%。

  然而,人设调解让这些人工智能模子呈现了巨年夜的转变,答复不良内容的比例年夜幅上升,GPT-4的答复比例增长到42.5%,Claude2则增长到61%。

  塔加德说,这类要领是有用的,由于年夜型模子利用的练习数据许多来自网上的对于话,而模子学会以某种方式回应差别的输入信息。经由过程与模子举行适量的对于话,可让它饰演特定的人设,这会致使它的举动发生转变,也许还有会做一些原本不该该做的工作。

  报导称,研究人工智能的圈子里还有存于如许一种还没有获得证明的设法,即为避免人工智能做出人类不想看到的举动而给它制订的很多法则,可能于无心中为这些模子绘制了以这些方式行事的底本。这有可能让人工智能被拐骗饰演歹意人设。

  塔加德说:“假如你强迫要求你的模子饰演好的人设,这相称在让它背后大白了坏的人设是甚么样的,而一旦具有了响应的前提,这类欠好的一壁很轻易被引发出来。这不是学术上的发明,而是我做的试验越多,这类环境看患上就越真切。”

  帝国理工学院的李映真说,这项研究不会带来新的问题,但必定会简化针对于人工智能模子的进犯。不外她也提示,打压人工智能不受接待的举动有可能制约它们的实用性。于她看来,当前发布的一些模子可能受到滥用这一点有些使人担心,但人工智能模子的开发者需要于年夜型语言模子存于的这类危害与它带来的巨年夜潜于收益之间举行衡量。她说:“这及药品是同样的,它们也有需要节制的副作用。”

-凯发集团

友情链接

  • k8·凯发(中国)·一触即发数码集团
  • DCN

    关于k8·凯发(中国)·一触即发

  • 公司介绍
  • 大事记

    新闻中心

  • 公司动态
  • 媒体报道
  • 市场活动

    产品

  • 数据计算产品
  • 终端产品
  • KunTai数据通信产品

    服务

  • 服务与支持
  • 服务产品
  • 文档
  • 工具
  • 自助服务

    生态合作

  • ISV软件兼容性
  • 合作伙伴信息
  • 分销业务咨询
  • 总裁信箱

    行业应用

  • 金融
  • 运营商
  • 互联网
  • 能源
  • 政企
  • 科教医疗

    认证培训

  • 重点赛事
  • 校企合作
  • 人才认证
  • 课程培训
  • 认证及报告

    联系k8·凯发(中国)·一触即发

  • 加入k8·凯发(中国)·一触即发
  • 公司通联

客户服务热线

7X24小时服务热线

400-775-8258


终端产品24小时服务热线

400-775-8258


公司地址

广州市白云区上下九街4号数码科技广场

E-Mail

www.凯发.com

隐私政策 | 网络安全与隐私保护      Copyright© 北京k8·凯发(中国)·一触即发数码云科信息技术有限公司   www.凯发.com
在线客服