好,第一个问题,搜索引擎为什么要把技术升级到HTTPS,这一个小小的“S”意味着什么?
其实长期以来,网络劫持一直是困扰搜索引擎的顽疾,搜索“百度无法访问 运营商劫持”可见每年都有不少结果。常见的劫持手段,无论是DNS还是TCP劫持,都会对用户造成不良影响:轻者至少能明显感知一次跳转,重者则会导致百度搜索结果为空白页,或者无法访问。更恶劣的劫持还会篡改百度搜索结果,在页面上加入自己的广告等。
严重到什么程度呢?举个栗子,某位用户在百度搜了“现货白银”一词,几分钟以后用户就收到了13封垃圾邮件、18个推销电话、23条广告短信。没错,他的个人信息被泄露了!无语吧?这种问题不仅仅出现在搜索引擎身上,所有使用HTTP明文传输的站点,都存在这一风险。
而HTTPS的这个小“S”您可以把它理解为一把“锁”。
以前如果用户访问百度,百度会给用户一个搜索结果,在这个过程中所有的信息传输全都是明文的,所以“中间人”,比如运营商、公司的网管,他完全能知道你传了什么内容,你搜了什么词汇——是不是很没有隐私的赶脚?
没办法,其实网络世界就是这样滴。
其实这时候对百度也是一种伤害:如果内容不加密,数据在从百度发往用户的过程中就有可能被篡改,或者加点广告……什么的,从而损害百度的品牌利益。
全部改成HTTPS以后(包括后期无线端的落地),用户传输的数据就不是明文的了。百度返回的内容呢,除了该用户外也没有人知道——就是加密传输了。不仅不能被“中间人”读取,也不能被篡改。
ok,有人肯定会说,那百度知道啊,百度会不会泄露,在这个问题上,我只能说,如果百度想泄露的话,那他们就不必搞这个加密的项目HTTPS了——不搞这个加密项目,出了事尽可以往“中间人”环节上推诿,加了这个项目再有泄露,不就百度一家可以怀疑了么?
第二个问题,从HTTP到HTTPS要付出多大成本?
这是个关键问题——成本,你愿意花多少钱来保护用户隐私呢?俺听说的是,要加上这个“S”,第一是钱,第二是人,第三是服务器。
钱的成本自然不必多说,据说百度为此投入了数千台服务器,上亿元的成本。当然,不仅仅是钱,技术难度也相当大,相当于百度把整个搜索的元素进行了HTTPS的改写,为了保证用户的搜索响应速度,还需要大量技术优化。甚至还有一个体力活,就是百度需要把所有网页元素做一个改造,这需要很多人来做,把整个百度搜索的主域改成HTTPS,且要把主域上所有的子域改成https。这就需要推动全公司数十个产品线一起进行更改。
百度其实从很早就开始布局做这件事了,背后有着对众多技术难题的攻克,从搜索基础架构调试,到全部主域及子域名的修改,再到速度的优化,最终解决了困扰多年的中间者劫持问题,这半年来投入的程序猿、攻城狮加起来得有上百人,而且一共有二十多个产品线在做这件事。作为互联网巨头,百度做全站HTTPS这件事,真真体现了它强大的技术实力啊。
第三,如果百度HTTPS了,整个行业怎样?
这个HTTPS肯定是百度搜索生态安全的其中的非常重要的一环。百度后面推安全搜索,进而可以在说影响整个中国互联网。
或者说,那些非HTTPS的网站,百度会不会不给他们传用户隐私相关的信息了?而那些采用了HTTPS的网站,百度或将会给他们在排序上进行加权,这对站长的吸引力是非常大滴呦,毕竟搜索引擎是大部分网站的最大入口。
其实,我们更期待看到在百度之后,更多的企业一起去推进完成HTTPS化的过程,在百度的带领下,希望中国互联网全站HTTPS的那一天会更快的到来。
(责任编辑:安博涛)