当前位置:主页>产 业>业界新闻>

使用机器学习来帮助安全服务

  美国国务院每年对20亿封电子邮件进行分类是一项艰巨的任务。目前,其已经看到了机器学习和自动化的好处。

  美国安全部门的协调失败已经在诸如9/11袭击事件之后被广泛报道。美国安全部门工作人员可能会获得防止攻击所需的知识,但是缺乏协调,导致这种情况没有应该拥有的人才。结果,发生了本可预防的暴行。

  最近一篇文章探讨了如何使用人工智能来改善美国国务院的内部流程。该部门这项工作特别感兴趣的是,如何更好地正确分类每年在内部生成的大量电子邮件。

  进行分类

  该部门被认为每年产生约20亿封电子邮件,其中许多包含分类信息。然而,了解(并因此正确地标记)秘需要分类的内容是一项艰巨的工作。

  研究人员使用机器学习来改善这一点。他们开始通过训练他们的算法从上世纪70年代美国国务院和海外外交官之间的通讯的大约一百万封邮件分类。每封邮件以前都标记为秘密,机密,有限的官方使用或未分类。

  在训练了系统之后,他们设置这个系统工作,以查看它是否可以正确地分类文档,特别是它是否可以正确地标记内容应该是分类状态。

  该算法在这样做时证明是特别有效的,其在分类内容的成功率为90%,错误率仅为11%。更重要的是,团队认为他们可以用更好的数据做更好的工作。

  什么使这些内容进行分类?

  除了对内容进行分类的能力之外,这项工作还揭示了一个有助于其安全状态的信息方面的新亮点。例如,出现了某些单词的频率是整个消息的安全状态的最佳指示符,而发送者和接收者更不可靠。

  有趣的是,机器分配的一些错误标签实际上被证明是人为的错误。换句话说,他们应该被分类,但人类却标记了它们。

  这表明,机器可以在确保内容被正确分类方面发挥越来越重要的作用,但是为了使其有效,人们需要有良好的质量数据来训练机器。

  此外,该工作还具有揭示数据共享中的模式的潜力,以及实际上在人们的安全服务中的数据移除,其本身可能具有安全影响。毕竟,分类内容有丢失的习惯。

  虽然这无疑是有趣的,但也很清楚,这样的过程是一个非常早期的阶段。然而,鉴于美国国务院每年花费数十亿美元对文件进行分类,这项工作有希望值得进一步发展。

(责任编辑:宋编辑)

分享到:

更多
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
  • 微笑/wx
  • 撇嘴/pz
  • 抓狂/zk
  • 流汗/lh
  • 大兵/db
  • 奋斗/fd
  • 疑问/yw
  • 晕/y
  • 偷笑/wx
  • 可爱/ka
  • 傲慢/am
  • 惊恐/jk
用户名: 验证码:点击我更换图片
资料下载专区
图文资讯

国务院关于印发 “十三五”国家信息化规划

国务院关于印发 “十三五”国家信息化规划的通知全文

“十三五”时期是全面建成小康社会的决胜阶段,是信息通信技术变革实现新突破的发轫阶...[详细]

使用机器学习来帮助安全服务

使用机器学习来帮助安全服务

美国国务院每年对20亿封电子邮件进行分类是一项艰巨的任务。目前,其已经看到了机器学...[详细]

从雅虎10亿事件回顾数据泄露的这11年

从雅虎10亿事件回顾数据泄露的这11年

日前,雅虎公开承认,在2013年8月的时候就发生了多达10亿的账户数据泄露。同时也创造...[详细]

学习领会法律实质内涵 《网络安全法》宣传

学习领会法律实质内涵 《网络安全法》宣传大会在京召开

2016年12月27日,由中央网信办网络安全协调局指导,中国信息安全测评中心主办,中国信...[详细]

国家互联网信息办公室发布《国家网络空间安

国家互联网信息办公室发布《国家网络空间安全战略》(附全文)

今天上午,经中央网络安全和信息化领导小组批准,国家互联网信息办公室发布了《国家网...[详细]

返回首页 返回顶部