DarkBERT：诞生自暗网的AI，全球首个基于暗网训练的AI模型

2023-05-26 09:32 来源:极客网

与ChatGPT或Bard之类的聊天机器人不同，该模型旨在创建一个工具来分析数据集并回答特定的查询。DarkBERT可以验证使用暗网作为数据集是否能让AI工具更好地理解这些环境中使用的语言，从而可以为网络安全专业人员和执法部门提供帮助。

据外媒报道，韩国研究人员最近开发了一种基于暗网数据训练的大型语言模型DarkBERT。这个AI模型旨在帮助网络安全专业人员从暗网提取有关网络威胁的情报。

DarkBERT可以研究暗网，以识别和标记潜在的网络安全威胁，包括数据泄露和勒索软件。

韩国科学技术院(KAIST)的研究人员与数据情报机构S2W开展合作，开发出生成式AI语言模型DarkBERT，该模型专门针对来自暗网的数据集进行训练。

与ChatGPT或Bard之类的聊天机器人不同，该模型旨在创建一个工具来分析数据集并回答特定的查询。DarkBERT可以验证使用暗网作为数据集是否能让AI工具更好地理解这些环境中使用的语言，从而可以为网络安全专业人员和执法部门提供帮助。

DarkBERT：诞生自暗网的AI，全球首个基于暗网训练的AI模型

研究人员使用Tor网络训练AI模型

为了优化DarkBert适应暗网上使用的语言，研究小组通过爬行代理Tor网络创建了一个大型数据库。该研究团队还采用重复数据删除、数据过滤和预处理技术，以减轻与暗网内容相关的道德担忧，而暗网内容通常包含大量敏感信息。

该模型在16天内输入了两组数据，其中预处理的数据包括受害组织的名称、泄露数据的详细信息、威胁声明、非法图像等信息。

由于暗网的信息存在潜在风险，DarkBert在短期内不会向公众开放。然而，用户可以提出将这个AI模型用于学术目的的请求。

THE END

免责声明：本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的，皆为无意。如您是字体厂商、图片文字厂商等版权方，且不允许本站使用您的字体和图片文字等素材，请联系我们，本站核实后将立即删除！任何版权方从未通知联系本站管理者停止使用，并索要赔偿或上诉法院的，均视为新型网络碰瓷及敲诈勒索，将不予任何的法律和经济赔偿！敬请谅解！

相关阅读

像GPT-4这样的大型语言模型在应用中出现的涌现能力是幻象吗？2023-05-25
云知声发布山海大模型现场实测十大核心能力2023-05-25
中国工业机器人消费量连续九年位居全球首位2023-05-25
甲骨易AI 研究院发布“超越”中文大模型测试集2023-05-23
360上线“AI商店” 将集成全球人工智能工具2023-05-23
对标 ChatGPT，华硕子公司台智云发布福尔摩斯大模型2023-05-22
360上线“AI商店” 将集成全球人工智能工具2023-05-22
云从科技发布从容大模型2023-05-18
北京拟对 AI 训练所需的算力推行统筹供给，整合大模型中文语料库2023-05-18
集成ChatGPT、开发大型语言模型，Zoho公布AI战略计划2023-05-16

展会预告

新品

中维世纪新品 | 这样的火眼金睛，才够格做“黑悟空”“天命人”
中维世纪又推智能场景机!此次场景机在看清电子屏幕的基础上，增加字符提取与超阈值报警功能，超清视野与灵…
中维世纪新品 | 这样的火眼金睛，才够格做“黑悟空”“天命人”
思特威推出具有AOV快启功能的5MP高分辨率IoT图像传感器SC535IoT
思特威推出0.7微米5000万像素图像传感器SC5000CS
云天励飞发布新一代AI芯片DeepEdge10
爱芯元智发布新一代IPC SoC芯片AX630C和AX620Q

访谈

更多

做行业赋能者 HID迎接数字化浪潮新机遇破解新挑战

今年3月份，全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》（以下简称“报告”），该报告…
数字化浪潮下，安防厂商如何满足行业客户的定制化需求?

回顾近两年，受疫情因素影响，包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击，市场…
博思高邓绍昌：乘产品创新及客户服务之舟，在市场变革中逆风飞扬

11月24日，由慧聪物联网、慧聪安防网、慧聪电子网主办的2022(第十九届)中国物联网产业大会暨品牌盛会，在深…

企业

圣恩科技：守护城市生命线
树立行业标杆，讲好中国故事，传递中国声音，充分展现腾飞的中国经济、崛起的民族品牌和向上的企业家精神。…
佳都科技“数智堤坝”助力地铁安全度汛
高新兴与麒麟软件达成战略合作，加速国产化应用生态布局与落地
圣恩科技：守护城市生命线
熵基科技在多模态BioCV技术领域取得新突破
捷顺科技发布“停充一体”标准，打造一站式停充服务，推动停车充电行业规范发展