第784章 计算机学习(2 / 2)

大时代之巅 荒野悲歌 1631 字 7个月前

周不器缓缓的道:“不知道许亮杰跟你说没说过,紫微星目前有两个内部项目,也属于人工智能的范畴。”

沈向阳道:“他没跟我谈业务的事。”

周不器点了点头,“嗯,这算是公司机密。我跟你说说。其中有一个项目,是个性化的内容分发,根本不同的用户信息,来通过信息流的方式分发相应的广告和内容。”

“朋友网的广告?”

“对,主要是今日头条,这是我们内部的一个项目,9月份会上线,会有内容的分发。”

周不器就简单的说了一下今日头条内容分发的理念。

沈向阳略作思考,沉吟道:“如果是这种模式,简单的个性化分发是不够的,这不够精确。必须要有更复杂的算法支持,这需要使用到深度的计算机学习。”

“什么说?”

“嗯……”

沈向阳有些头疼,他最烦跟外行探讨深度的技术问题,可对方是老板,又不能不解释,想了一下,说道:“这样,你问我5+5等于几。然后我模拟计算机,给你解释一下。如果我说错了,你要给出正确的答案,然后多问几遍。”

周不器觉得挺有趣,笑道:“行,那我问啦。咳咳,5+5等于多少?”

沈向阳道:“88。”

周不器微微一愣,明白了他的意思,帮他改正,“不对,是10。5+5等于多少?”

沈向阳道:“24。”

“不对,是10。5+5等于多少?”

“17。”

“不对,是10。5+5等于多少?”

“12。”

“不对,是10。是5+5等于多少?”

“10。”

“对了。5+5等于多少?”

“10。”

“5+5等于多少?”

“10。”

沈向阳做出了这个解答,然后接结束了这个问题,“这就是机器学习的逻辑。当然不是算术了,而是计算用户对广告或者内容的喜好度。其实针对广告的个性化投放,不能根据广告本身,而是根据内容。朋友网的个性化广告我看了,主要就是根据用户的个人信息,这略显粗糙,准确率也不高。”

“那应该怎么做?”

“通过机器学习,把广告和内容捆绑。比如阅读内容a的用户,都喜欢广告a,两者就可以对接了。这个比较简单。更复杂的是内容投放,要结合统计学习和神经网络,通过机器学习,让计算机学习用户的阅读习惯。就像刚才的算术题一样,一开始,错误率比较大,越是学习,错误率就越小,就越贴近正确答案,即用户的阅读习惯。”

周不器不太服气,透露了点小秘密,“朋友网的个性化广告分发算法,是facebook做出来的呢!嗯,我们是合作伙伴。”

“这样啊……”沈向阳笑了笑,“facebook的技术也不怎么样。”

“呃……”

口气真大!

好吧,这哥们的确够资格讽刺facebook技术差。

周不器接着说:“还有一个项目,我们都做了半年了,一点头绪都没有,我们派出了一个很厉害的技术大牛,叫徐铭,他也没办法。他本来是搜索事业群的技术总监,不过项目没进展,接下来就把他调进研究院,你来带吧。”

“什么项目?”

“智能搜索,个性化搜索,千人千页。”

其实就跟个性化内容推荐差不多,不同的是,这次是针对搜索结果的个性化推荐。

沈向阳脸色就凝重起来,“这可难多了!比那个朋友网的个性化广告,今日头条的个性化内容都难。”

“是吗?不都是个性化推荐吗?”

“级别不一样。”

“嗯?”

沈向阳解释道:“技术难题往往是两点,一类是复杂度,一类是规模量。比如photoshop、matlab这种工程软件,就是太复杂了,我们国内做不出来。规模量指的是数据多少。一个算法,处理小数据时可能很奏效。可是涉及到大规模数据,算法就失效了。就像手工制作和机械化批量生产一样,没有可比性。”

周不器点了点头,“嗯,大数据。”

沈向阳道:“大数据算法是一套,个性化算法是一套,大数据下的个性化算法,又是另外一套。这并不是简单的1+1=2的关系,需要从算法框架方面有更优化的设计。智能搜索这个概念前两年就提过了,可是做不到。”

现在,全世界连大数据都没搞明白呢,对大数据下的衍生算法,更是想都别想。

这么一看,还是老沈技术更高、视野更广、认知更清楚啊!

智能搜索这个项目,是许亮杰、程秉皓、王小船和徐铭共同决定的,觉得这个方向大有可为。可沈向阳却给否了,说做不到。

嗯,一家公司,肯定是技术最好的人当首席技术官。

老沈实至名归啊!