21805小说网>奇幻小说>暖床侍妾 > 第五章-Hadoop
    听过许亮♤杰的话,周不器又叫来首席技术官程秉皓,也详实沟通了一下搜索的事。

    新浪的爱问搜索,就是他带队做出来的。

    如果他🅅🄋去年不离开新浪,说不定凭借此功🁄🃓🗚劳,就能晋升为👘🉊新浪的cto了。

    不过,他现在是紫微🆂🌭星的cto,也一⛂🗩🞎点不⚈🏜差。

    程秉皓的看法跟许亮🆂🌭🆂🌭杰差不多,而且🌁更加地本土化。

    “百度为什么做内🟂🚓容?因为在国内做搜索,做内容是🈘⚌唯一能够生存下去的方式。”

    程秉皓的看法更加的锐利直接。

    在国内做搜索,跟硅谷不一样,要根据法律法规,要移除和屏蔽一些内容。以及要贴心的为用户考虑,通过一些深⚦📦度算法,帮助用🔪户移除一些深度的专业🚽化内容。

    因为越专业越小众,越庸俗越大众。

    要想获取最多的大众用户的喜爱,不能提供太专业的内容,而是要提供一些浅白易懂🄽🃃🕄、不那么复杂的搜索结果。

    比如百🅅🄋度那边已经在做机器学习,也就是🁄🃓🗚最早期的人工智能。即通过用户搜索结果以及对搜索结果的反馈,来让机器学习。从而在未来搜索的时候,让机器帮🈦🀢⚄忙推荐更符合大众口味的最优解。

    这就又产生了一个🟂🚓好处,可以进一步的缩小检索范围🈘⚌。

    百度的搜索技术比不上谷歌,差距之大……远远超出想象。其实也不止百度了🋧🛩,雅虎🄽🃃🕄、微🃀🔨软也一样。

    谷歌能在最短的时间内,在海量的互联网数据中搜索出相👘🉊关内容,🂀🋭然后根据算法排列,呈现在用户电脑前。

    可其他的搜索引擎不行。

    要想给用户提供最快的响应速度,怎么办?

    最简单的方法,就是缩小检索目标。

    谷歌检🅅🄋索10亿条信息,百度就检索🌁1亿条信息。

    信息来源少了,搜不出想要的答案,🌁也就不奇怪☖⛃🗮了。🈘⚌

    所以,百度要想坐稳国内第一的宝座,就一定、只⛴🞣🖀能、必须做内容。通过自产的内容,来弥补检索技术方面的弱项。

    这种方法,🙱🎊没法满足高端用户的需求,却可以满足全社会中80%的用户需求了,这就够了。

    可🊎🏋😥以说,百度的李🟂🚓总通过正面退怯、背后游击的方式,完成了对谷歌在搜索领域霸权的挑战,并🅑🅹🋢且成功了。单从这一点来说,可比微软、雅虎等巨头强了不少,那伙人还在苦哈哈的想跟谷歌玩技术呢。

    玩个屁啊,根本不是一个量级的。

    在大数据处理的领域,全球科技公司都要依靠一个叫hadoop🂀🋭的开源核心架构。这个架构来源,就是谷歌对自身算法理论的公开,却没有公开🙬算法细节。所以雅虎和阿帕奇就牵头合作,召集了一大批顶尖科学家,根据谷歌的算法理论,做出了这个大数据处理系统。