思维,大数据,多维度思维.大数据时代的核心

tdavidwang 2016-10-20 06:26:53

多维度思维,大数据时代的核心

大数据

2016-10-19 猴子聊人物 大数据

来源:猴子聊人物(ID:houzichedan

最近拼车,车里一位哥们在侃侃而谈:现在的互联网+,除了打车,其他都是扯淡,没啥用。

我相信现实生活中,这样忽视大数据时代已悄然来临的人不是少数,而且还很多。

毕竟,在中国13亿人口中,从事大数据行业的人连2%都不到,更别说真正理解大数据的人了。

你也许会说,大数据是那么高深的技术,我又不做相关的技术,了解那么多干什么。

其实,今天我们谈的不是什么复杂的大数据高深技术,请注意文章前面的标题:时代。

是的,我们谈的是一个新时代下的个人选择问题。说的更本质一些,其实是在说明这样一个新时代(大数据时代),人类的思维发生了怎样的改变。

进而,我们思考这种思维改变会给个人未来的成长带来怎样巨大的改变和机会。

进一步,你最后会明白这几个问题的答案:

1)为什么中学老师在许多年之后总是感叹:最终,真正有出息的,都是当年成绩一般般的... ...

2)从1984年洛杉矶奥运会开始,到尽头,国人关注奥运会已经32年了。当年的金牌得主们,除了李宁和郎平,剩下的谁记得呢?

3)为何以前起作用的死磕思维,在大数据时代,不是最好的人生策略选择。

而理解和解答所有的这些问题的前提是,你要真正明白什么才是大数据时代的核心?

好了,废话不多说,我们先来看看在没有大数据之前,人类的思维模式是怎样的?

在大数据之前,计算机并不擅长于解决人类智能的问题,即我们现在所说的人工智能。

怎样才算人工智能呢?

真正科学定义这个概念的是电子计算机的奠基人 阿兰·图灵(Alan Turing)。

1950年,图灵在《思想》杂志上发表了一篇题为《计算的机器和智能》的论文。在这篇文章中图灵提出了影响至今的图灵测试,现已成为验证机器有无智能的标准判别方法。

图灵测试的原理其实很简单的:就是让一台机器和一个人同时坐在幕后,然后请一个裁判同时与幕后的人和机器进行交流。如果这个裁判无法判断自己交流的对象是人还是机器,就说明这台机器有了和人同等的智能。

简单直白吧,其实很多真正有用的人生哲理,也就是这么简单直接。只不过人类天生有喜欢秘密的天性,所以很多人更愿意追逐秘密,而非有用的道理,这也是为何从古至今八卦永盛不衰的道路。

后来,计算机科学家们认为,如果计算机实现了下面几件事情中的一件,就可以认为它有图灵所说的那种智能:

1.语音识别

2.机器翻译

3.文本的自动摘要或者写作

4.战胜人类的国际象棋冠军

5.自动回答问题

当然,今天的计算机已经可以做到这些事情,而且还会超额完成更多的智能问题。例如2011年,IBM研发的智能计算机Watson参加综艺节目《危险边缘》来测试它的能力,这是该节目有史以来第一次人与机器对决。Watson在前两轮中与对手打平,而在最后一集里,Watson打败了最高奖金得主布拉德·鲁特尔和连胜纪录保持者肯·詹宁斯。Watson赢得了第一笔奖金100万美元。

我们从语音识别这个角度来看下,人类是一开始如何思考解决这个问题的:

首先,能想到的是去了解人的大脑是如何识别语音的,然后让计算机按照人的思路去做。举个例子,就拿我们以前学英语,死记硬背单词和句法,当单词量达到一定程度后,就可以理解外国人的话。

事实上,当时各个大学和研究所的专家们在这个问题上就是这么做的,而且已经死磕了20多年的时间。

主要采用的研究方法就是:基于语法规则和语义规则,利用人工智能的方法理解人所讲的完整的语句。

这个研究方法的思维就是在数学模型这个单个度上死磕,直到“磕的吐血”为止。

我把这种传统的研究思维方法起了个有趣的名字叫:单维度死磕思维。

按照这种方法,经过20多年的研究,在20世纪70年代初,语音识别这个智能问题解决到什么水平呢?

当时按照这个思维方法做出的最好语言识别系统大约智能识别几百个单词,而且识别率只有70%左右。同时,面对机器人讲话要清晰,不能有方言,不然机器真识别不了。假如王宝强去说,机器估计会想:这是什么鬼,咋听不懂呢?

这种单维度死磕思维,在很长时间指导人们的行为(知道现在大部分人都是单维度思维),最典型的例子是以前我们读书老师讲的一句话:

学号数理化,走遍天下都不怕。指的就是在数理化这条单维度的方向死磕。

单维度死磕的好处是你可以在某一个领域变的足够强,但是它也有致命的缺点:就是由于你将全部注意力集中在这个维度上,你的视野和见识会很小,往往看不到其他维度的事情,从而导致无法认识世界。

直到一个人的出现,才打破了人工智能研究方法的僵局。同时,开启了人类思维的新时代。

我把他的研究方法称为:多维度思维,而这也正是大数据时代的核心。

这个人是谁呢?

1972年,康奈尔大学的教授 弗雷德·贾里尼克(Fred Jelinek,1932—2010) 到IBM做学术休假,正好当时IBM想开发出具有人工智能的计算机,贾里尼克就负责起这个项目。

语言识别和机器学习先驱~贾里尼克

他选择解决的问题就是:如何让计算机自动识别人的语音。

值得一提的是贾里尼克原本并不是一位人工智能专家,他其实是一位通信专家。

由于跨界的原因吧(进入一个新领域),他看待语言识别的角度和先前的人工智能专家都不相同。在他看来,语音识别不是一个人工智能的问题,而是一个通信问题。

贾里尼克认为,人的大脑其实是一个信息源,声音从外界传播到耳朵,一个解码的过程。而大脑从思考到找到合适的语句,再通过发音说出来,是一个编码的过程。

这么一想,贾里尼克就找到通信领域的对应数学模型来解决语言识别这个问题,而彻底抛开了人工智能的那一套做法:单维度死磕。

在找到合适的数学模型后,贾里尼克并像以往一样死磕模型这个维度,而是找到数据这个维度来提高准确度。

贾里尼克的做法是用统计方法和大量的数据来训练模型的。幸运的是,在但时只有IBM具备语音方面的大量数据。

为何只有IBM具备这些条件呢?

在那个年代,IBM在全世界计算机乃至整个IT产业可以说是处于独孤求败的地位。20世纪60年代末,IBM的市值达到500亿美元,这在当时是个很大的数目,占到了美国GDP(国内生产总值)的3%以上。

虽然IBM现在市值下滑很严重,也在做大数据方向的转型,但是不可否认IBM仍然是一家伟大的公司,未来价值也巨大。

贾里尼克的团队花了4年的时间,就开发了一个基于统计法和大数据的语音识别系统,它的语音识别率从过去的70%左右提高到90%以上,同时语音识别的规模从几百词上升到两万多词。这样语音识别就有了本质的飞跃。从此,语音识别就能够从实验室走向实际应用了。

贾里尼克在研究语音识别时,无意中开创了一种多维度(统计+数据)的方法解决智能问题的途径。由于这种方法需要使用大量的数据,因此现在又被称为数据驱动方法,这也是现在大数据解决问题的思维办法。

即不在数学模型这一个维度上死磕,而是通过大量数据这个维度来解决以往解决不了的问题。这种方法最大的好处是,随着数据量的积累,会变得越来越好。

李开复就是在这样的背景下,在传统的人工智能实验室里,采用这种多维度的方法开展他的博士论文的工作,并且最终和洪小文一起构建了世界上第一个大词汇量、非特定人、连续语音识别系统。

随着互联网兴起之后,数据的获取变得非常容易,所以大数据的这种多维度研究方法也变的流行起来。

可以说,贾里尼克开启了人类思维的一个里程碑:多维度思维

基于多维度思维,我们可以分析数据中的多个维度的相关性,往往可以获得意外的收获。

举个例子,猴子我以前为客户做女性购物数据分析的时候,在分析之前,大家普遍认为网上购物产品页面详情应该不需要太多的字,尤其现在手机屏幕那么小,会造成用户体验差的感受。

但是,经过分析网上排名前50的店铺的多个维度,我发现这样一个有趣的现象:对于女性网上购物用户,产品详情页面越长越详细越好。

基于这个分析结果,客户调整了页面展示和营销的策略,从而提高了店铺的销售额。

现在我们知道了,从 传统思维方法 到 大数据新思维方法 的出现,人类其实是经历了一个很长时间的思维转变,而这个思维也成为现在大数据时代的核心:单维度死磕思维 -> 多维度思维

只有深刻认识到这个时代思维转变的核心,我们才能彻底从大脑认知底层理解:为何个人在这个新的时代,适应转变成多维度跨界思维变的那么重要?

因为,在任何一个单一的维度上,能做到“第一”的只有一个人,只有少数人“名列前茅”,剩下的绝大多数都是“落后”。想想,你在自己的领域多久才能超过那个第一,或者名列前茅的人呢?

但如果我们拓展开另外一个维度呢就会完全不同。

我们打个比方,你在A维度上打80份,B维度上打60分(勉强及格就可以),两个维度上相乘就是4200分。而你在A维度上的竞争对手是90分。

你的4200分和对手的90分比,谁的优势更明显呢?

你也会明白,实际生活中的人都是立体的,而不是平面的。在单个维度上,大家比的是人生的长度,而在两个维度上,大家的比的是人生的宽度.... ....

进而,你会发现一个新的趋势,现在跨界(即多个维度)赚取财富的人越来越多。他们事实上,都知道这样一个秘密道理:跨界能给自己拓展一个新的维度。

就拿微信公众大号来说,顾爷以前是做设计的,但是通过聊绘画,现在居然成了广告这个维度上的大号,赚钱赚到手软。如果顾爷真拼设计,真的搞不过这个维度上的顶级高手。

说到底,其实是因为时代变了,以前我们用的诺基亚手机都淘汰了,在新的时代,思维不转变就会一直产生这样的问题:为什么我和他的差距越来越大呢?

所以,我们现在知道文中开始那几个问题的答案了:

1)为什么中学老师在许多年之后总是感叹:

最终,真正有出息的,都是当年成绩一般般的... ...

由于在中国长期实行的是单维度的评价标准(传统的思维模式),使得大部分人只关注学习成绩这个维度。这在学校的时候其他能力(维度)不足也没有关系,但是步入社会后,就会发现多维度才是竞争的核心。

中学老师之所以感叹,就是因为没有想到,当初竟然不知道人生除了学习成绩之外,人还有很多其他的维度需要扩展。

2)从1984年洛杉矶奥运会开始,到尽头,国人关注奥运会已经32年了。当年的金牌得主们,除了李宁和郎平,剩下的谁记得呢?

李宁除了金牌这个维度,他还增加了商业这个维度。

(值得一提的是李宁的父亲是健力宝的创始人,他父亲的经历太过传奇和曲折,后面有机会写出来探讨)

3)为何在某个技能上死磕,在大数据时代,不一定是最好的策略选择,那什么才是这个时代好的策略?

时代不同了,在大数据时代,多维度打造竞争力才是更好的选择

单维度能扩展你人生的深度,但是多维度却可以扩展你人生的宽度。

在认知上有了这个概念以后,却不去执行,就好比恋爱的时候知道泡妞的理论,却迟迟没有下手去追,三个字:不执行没有任何用。

那么,如何执行多维度策略,在大数据时代,打造个人竞争力呢?

首先,我们应该反省下自己擅长的领域是哪些,然后围绕这个领域你可以扩展的维度有哪些。

以我个人为例,我擅长的领域是编程(大概可以打80份),围绕编程这个领域,我扩展了数据分析(大概可以打70分)和人物写作(即现在的 猴子聊人物公众号 可以打60分)。根据对自己的反思和分析,我用数据分析语言R做了下面这个图:

值得注意的是,图中60分是及格线,我又将它取名叫平庸线。因为一个维度没有及格的话,说明你在这个维度上是平庸的,那就不能算作你的维度,因为它分数太低,不起作用。

所以,想让自己不平庸的最直接的办法,就是在有限的维度上提高积累,然后组合打出漂亮的“组合拳”(跨界)。

这点对我最直观的改变是,在反思过后,我利用自己大数据领域的数据分析,和自己的写作特长的组合,成为一家营销公司的顾问。要知道,现在搞营销,也是要建立在数据分析之上的。当然,我还是一家公司的数据分析师。

如果你也想在未来变成一个有竞争力的人,而不被时代淘汰,不妨也画出你的人生维度分析图,去反思该从哪些维度方面去积累和整合资源。

如果你想制像上面那样的人生维度分析图,可以在后台给我留言:只需要告诉我你每个纬度上的得分,我会将制作后的图给你。

人最可怕的就是不了解自己,在错误的方向努力,而多纬度图可以清晰的展示你目前的水平,尽快发现你该努力的方向。

近期精彩活动(直接点击查看):

福利 · 阅读 | 免费申请读大数据新书 第13期 

END

版权声明:

转载文章均来自公开网络,仅供学习使用,不会用于任何商业用途,如果出处有误或侵犯到原作者权益,请与我们联系删除或授权事宜,联系邮箱:holly0801@163.com。转载大数据公众号文章请注明原文链接和作者,否则产生的任何版权纠纷与大数据无关。

大数据

为大家提供与大数据相关的最新技术和资讯。

长按指纹 > 识别图中二维码 > 添加关注

近期精彩文章(直接点击查看):

160904 2016年创业公司死亡名单:融资10亿、用户千万也救不活了!

160830 被失业!未来六大传统产业将这样被颠覆(超现实)

160829 为何你只能做出渣图表?数据可视化的十大误区

160828 2分钟读懂大数据框架Hadoop和Spark的异同

160827 说说什么是数据挖掘

160823 裁员浪潮+寒冬大逃杀,互联网人该何去何从? 

160820 39个大数据可视化工具,哪个才是你的菜? 

160816 上班族每次在地铁上花费37分钟,经过9.78站|2号线是上海经济命脉|上海地铁数据趣味研究

160812 五亿姓名数据分析|TF-IDF算法揭秘中国人名密码

160803 傅盛:深度学习是什么?

160731 力荐!大数据等各种IT技能图谱(全套13张)

160716 2016年上半年大数据方向就业形势重磅出炉

160714 关于反爬虫,看这一篇就够了

160710 他是比尔盖茨的偶像,用50年写出编程圣经,被奉为程序员鼻祖

160627 Hadoop创始人Doug Cutting谈未来大数据的技术

160614 世界顶尖数据科学家看未来十年大数据发展

160606 为不擅长编程的人准备的19个数据科学工具 

160522 长文 | 大数据思维的十大原理

160520 不让谷歌进来是对的。。。

160519 史上最全的大数据分析和制作工具

更多精彩文章,请在公众号后台回复000查看,谢谢。

阅读原文
阅读
精选留言

该文章作者已设置需关注才可以留言

写留言

    该文章作者已设置需关注才可以留言

    写留言

    加载中
    以上留言由公众号筛选后显示

    了解留言功能详情

    文章来源