传统搜索的最后丧钟已经敲响.md

今天偶然刷微博看到了搜索引擎 Magi.com, 它最大的特点就是显示在第一个搜索结果的这个知识图谱和评分. 于是我搜到了这个知乎问题:

如何评价 Peak Labs 的你没玩过的船新版本的搜索引擎 Magi ?
我的回答是 - "Magi 是第一个让我期待 我的输入她能给出什么结果的搜索引擎"

搜索引擎的本质

传统搜索引擎的本质是中介. 在最初, 这个中介可以在好多方向混得很好.
但黄金时代已经过去, 移动互联网肢解了这一切, 购物中介? 打开购物APP, 吃饭中介? 打开外卖APP, 打车中介? 打开打车APP. 应有尽有.
传统搜索能赚到钱的地方, 全都被一个个APP瓜分掉, 只留下搜索最本质的用途: 媒体内容(文字, 图, 视频等)的中介.

也许有人会问, 搜索引擎也有移动APP, 所以还能占有一部分移动端市场吧?
那么我们再从另一个维度来看这个问题. 那就是传统搜索引擎APP的时间片也会被抢走.

这个理论是这样的. 每个人每天的时间时有限的, 都是24小时. 那么我们可以得出, 每个人每天用来使用网络的时间肯定是小于等于24小时的. 我们进而可以得出, 使用APP的总体时间也是有限的, 并且使用每个APP的时间也是有限的.
那么, 如果使用一个APP的时间增长, 在总体使用时间不怎么变的情况下, 使用其他APP的时间势必会缩短.
举例来讲就是, 一个大学生每天玩4小时手机, 假设他沉迷玩知乎, 那肯定刷微博的时间就比水知乎要短很多了.

这时问题出现了, 这个大学生使用移动端搜索APP的时间预计是多少?
现在又出现了新情况, Magi 可以满足他针对内容搜索的需求, 比如写作业, 按一下就能提供提纲无脑写那种.
试问, 这个大学生使用传统移动端搜索APP的时间是会下降还是会增长?

上面的描述的核心就是, 每出现一款会占用用户时间片的APP, 其他APP的被使用的时间势必会降低.
而被其他类型APP占据市场的搜索引擎, 自然用户使用的时长会惨不忍睹. 这个使用时长数据就会反馈到 DAU 上.

我们再从另一个维度去考虑, 搜索引擎从来不是全部流量的终点. 纵然搜索引擎有 onebox 这种东西 (onebox 就是比如你搜索计算器他会有个计算器嵌入到搜索结果中, 而不是提供一个计算器的网站让你点击进去).
onebox 可以让流量沉淀. 但同样移动 APP 对 onebox 有十足的杀伤力. 你查航班是更愿意用买机票的 APP 查询, 还是愿意用搜索引擎的 onebox 呢?
很明显买机票的 APP 更具有优势, 因为查询机票很有可能就是为了买机票. 那么传统搜索引擎只能服务那些不想买票但想查询这个航班的信息的例外情况了.
是不是突然有了熟悉的感觉? 没错, Magi 就是服务于这个场景的. Magi 抓住了那些有可能在搜索引擎沉淀的流量的头部需求.

至此, 传统搜索引擎的应用场景出现被彻底取代的可能:

没错, 不是"搜索是互联网的基础服务不会被取代", 而是 "大搜索很可能不会再是互联网的基础服务".

Magi 做对了什么?

Magi 的关注点恰恰是在移动互联网冲刷下的用户搜索行为的本质, 并且做了一个微小的改进 - "帮你思考".
当你想了解事物或信息, 传统搜索引擎仅仅按照结果的权重 (Page Rank) 展现给你, 你需要自己判断信息的可靠性, 归纳要点, 从中筛选你最想要的信息. 而 Magi 帮你做了这些.
退一步讲, 即使 Magi 的搜索结果比较惨 (现在就很惨), 这也不妨碍它成为一个可以为我提供观点和信息的工具.

也许有观点认为 Magi 只是 onebox 做得好一点而已. 其他搜索引擎也可以这么做. 但可能忽略最重要的一点, 传统搜索引擎为了更好的盈利, 即使做了类似的东西, 仍然会让自己的搜索结果偏向于商业化. 这是他们的收入来源, 不会做出根本上的改变.
这就会导致传统搜索引擎不可能变成一个专门为媒体内容检索服务而优化的应用. 当然, 这是我的大胆假设.

Magi 创造了一种新的需求, 他能满足你抄作业 (检索) 的同时, 还能满足你跟别人对答案 (看看别人的结论) 的需求. 这在过去, 只能通过 UGC 去完成, 比如你去知乎搜 "如何评价XXX". 现在, 你多了个选择, 看看 "Magi如何评价XXX".
而且这不冲突, 它虽然有导航的性质, 但同时 Magi 提供了置信度这个指标, 这非常重要, 正是这个东西让它区别于其他 UGC 内容. 如果你的脑洞足够大, 这就是 MGC (Machine-Generated Content) 的雏形.
你可能已经看过用 RNN 写的诗歌, 我相信完全有可能未来有一天我们会看到机器写的小说. 那么, 机器对一件事物或一个问题发表看法, 这又有什么不可能呢?

Magi 做得怎么样?

就我实际体验来讲, Magi 对专有名词表现最好, 但其中同义词不行, 会导致混淆.
除了上方展示的那个标志性 onebox, 其余所有搜索结果都需要相当的优化, 而且抓取范围太窄了, 长尾需求完全无法满足.

这是好的结果:

magi-1

这是不好的结果:

magi-2

好的结果方面, 搜索关键词 "CQRS", Magi 完全发挥出了之前所说的优势, 除了可以提供搜索结果以外, 还可以提供针对检索内容的参考信息和置信度, 让我很好的了解了 CQRS 是怎样诞生和服务于什么目的, 我可以按照这个图谱去进一步的了解 CQRS.
但搜索结果本身仍然有待优化, 这个搜 CQRS 的结果中, Bing 和 Google 的结果是最好的, 直接给出 Martin Fowler 的权威文章, 这也是 PageRank 做的好的优势. Magi 次之, 给了 Github 的相关链接, 不知道是不是 Github 的权重太高了. 而其它搜索引擎的结果惨不忍睹. 直接变成二手知识的受害者.

不好的结果就显而易见了, 搜索了 "nginx错误499", 中文搜索引擎全都只讲了怎么避免499, 完全不讲499为啥产生, 内容也是瞎猜的经验谈, 没有论据没有剖析, 沦为二手知识的受害者. 而 Google 和 Bing 都给出了很好的结果. 我也在 Magi 上用关键词 "nginx status 499" 搜索了, 没啥区别. 而在 Google 我用中文, 英文, 日文, 俄文搜索, 都能得出满意的结果.

一些彩蛋

我不知道选取 Magi 作为名称是不是想表达它的词义"魔术, 智者". 但我立刻想到了 EVA 里面的超级计算机 Magi (后经作者确认词源的确来自 EVA 和马太福音):

Eoe_magi_display

以及, 置信度评分让我想到了 <鲁邦三世 PART5> 里面的 ヒトログ (Hito-Log), 能对 SNS 中每条信息进行置信度评分:

ヒトログ-1

强烈推荐这两部作品, 感兴趣的同学可以去看看.

最后

总之我把网站加进收藏夹了. 期待 Magi.com 越做越好.