大时代之巅_ 第784章计算机学习（2/2）

    周不器缓缓的道：“不知道许亮杰跟你说没说过，紫微星目前有两个内部项目，也属于人工智能的范畴。”

    沈向阳道：“他没跟我谈业务的事。”

    周不器点了点头，“嗯，这算是公司机密。我跟你说说。其中有一个项目，是个性化的内容分发，根本不同的用户信息，来通过信息流的方式分发相应的广告和内容。”

    “朋友网的广告？”

    “对，主要是今日头条，这是我们内部的一个项目，9月份会上线，会有内容的分发。”

    周不器就简单的说了一下今日头条内容分发的理念。

    沈向阳略作思考，沉吟道：“如果是这种模式，简单的个性化分发是不够的，这不够精确。必须要有更复杂的算法支持，这需要使用到深度的计算机学习。”

    “什么说？”

    “嗯……”

    沈向阳有些头疼，他最烦跟外行探讨深度的技术问题，可对方是老板，又不能不解释，想了一下，说道：“这样，你问我5+5等于几。然后我模拟计算机，给你解释一下。如果我说错了，你要给出正确的答案，然后多问几遍。”

    周不器觉得挺有趣，笑道：“行，那我问啦。咳咳，5+5等于多少？”

    沈向阳道：“88。”

    周不器微微一愣，明白了他的意思，帮他改正，“不对，是10。5+5等于多少？”

    沈向阳道：“24。”

    “不对，是10。5+5等于多少？”

    “17。”

    “不对，是10。5+5等于多少？”

    “12。”

    “不对，是10。是5+5等于多少？”

    “10。”

    “对了。5+5等于多少？”

    “10。”

    “5+5等于多少？”

    “10。”

    沈向阳做出了这个解答，然后接结束了这个问题，“这就是机器学习的逻辑。当然不是算术了，而是计算用户对广告或者内容的喜好度。其实针对广告的个性化投放，不能根据广告本身，而是根据内容。朋友网的个性化广告我看了，主要就是根据用户的个人信息，这略显粗糙，准确率也不高。”

    “那应该怎么做？”

    “通过机器学习，把广告和内容捆绑。比如阅读内容a的用户，都喜欢广告a，两者就可以对接了。这个比较简单。更复杂的是内容投放，要结合统计学习和神经网络，通过机器学习，让计算机学习用户的阅读习惯。就像刚才的算术题一样，一开始，错误率比较大，越是学习，错误率就越小，就越贴近正确答案，即用户的阅读习惯。”

    周不器不太服气，透露了点小秘密，“朋友网的个性化广告分发算法，是facebook做出来的呢！嗯，我们是合作伙伴。”

    “这样啊……”沈向阳笑了笑，“facebook的技术也不怎么样。”

    “呃……”

    口气真大！

    好吧，这哥们的确够资格讽刺facebook技术差。

    周不器接着说：“还有一个项目，我们都做了半年了，一点头绪都没有，我们派出了一个很厉害的技术大牛，叫徐铭，他也没办法。他本来是搜索事业群的技术总监，不过项目没进展，接下来就把他调进研究院，你来带吧。”

    “什么项目？”

    “智能搜索，个性化搜索，千人千页。”

    其实就跟个性化内容推荐差不多，不同的是，这次是针对搜索结果的个性化推荐。

    沈向阳脸色就凝重起来，“这可难多了！比那个朋友网的个性化广告，今日头条的个性化内容都难。”

    “是吗？不都是个性化推荐吗？”

    “级别不一样。”

    “嗯？”

    沈向阳解释道：“技术难题往往是两点，一类是复杂度，一类是规模量。比如photoshop、matlab这种工程软件，就是太复杂了，我们国内做不出来。规模量指的是数据多少。一个算法，处理小数据时可能很奏效。可是涉及到大规模数据，算法就失效了。就像手工制作和机械化批量生产一样，没有可比性。”

    周不器点了点头，“嗯，大数据。”

    沈向阳道：“大数据算法是一套，个性化算法是一套，大数据下的个性化算法，又是另外一套。这并不是简单的1+1=2的关系，需要从算法框架方面有更优化的设计。智能搜索这个概念前两年就提过了，可是做不到。”

    现在，全世界连大数据都没搞明白呢，对大数据下的衍生算法，更是想都别想。

    这么一看，还是老沈技术更高、视野更广、认知更清楚啊！

    智能搜索这个项目，是许亮杰、程秉皓、王小船和徐铭共同决定的，觉得这个方向大有可为。可沈向阳却给否了，说做不到。

    嗯，一家公司，肯定是技术最好的人当首席技术官。

    老沈实至名归啊！