IT领域问题结构解析随笔

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享




IT领域实际上是个很大很大的领域,别看它的显式发展时间才六七十年,但是近几个世纪的知识的增长是指数形式的,所以相关的知识的产量非常之大。这意味什么呢?没有全领域专家!没有一个人完全了解IT领域,相比之下,可能有人可以几乎完全懂绘画史、各派画的风格等,但IT领域就不同了,没有全领域专家。事情一多就容易乱,我们就要理清头绪。IT领域的知识如此丰富,问题如此之多,也就需要整理一下它的结构;懂了这些结构,一方面能够很好理解整个领域,另一方面,很多决策——从庸俗的做什么赚钱,到伟大的用什么科技改变世界——都能够有一个更好的“理论”依据。然而这个活需要很多深入的洞察,我混不到三年,但还是想记一记自己的想法,对IT领域的问题结构的作一个自己理解下的粗略解析,没有什么太多构思,就是随笔随便记记。

S1.非技术性问题

好的,先从这里谈起。很多人以为做IT就是一定要技术,其实很多问题还不是技术问题!比如推广多银行卡的统一、手机支付等,属于运营或实际利益问题,技术上是没有太大问题的。从IT领域扯开,说远点,事实是,这个世界并不是那么理想的,很多问题,用一个童真的眼观看来是那么简单的,但做起来却完全不是那么回事。比如美国没有全民医保,有近百分十的穷人生活在极大风险中,一场大病可能彻底夺走他们的幸福生活,一个孩子就会说,那就全民医保呗,让大家都能快乐的生活多好,然而,这个奥巴马政府正在努力的为之奋斗的目标却受到许多美国民众的反对,因为医保的钱来自己人民,准确的说来自那些最穷的人以外的人,代表他们的议员们认为那些最穷的人是因为自己的原因(吃太多不干活)变得那么穷。唔,于是这场医改革命在美国打了半个多世纪还尚未解决[1]。扯远了,回归IT领域,原理是类似的。很多技术很先进的事业,但是由于需求不多(如“铱星计划”——全球卫星电话,在南极都能给全国任何地方打电话,但最后严重亏损关闭了)、既有利益划分问题(中国通信业的垄断等)、推广营销、公关、其他市场原因以及体制政策原因等,无法起步或走向失败。

上面说的那些非技术问题虽然似乎听起来似乎并不是很光彩的,但是它们也是必不可少的。在一个理想世界中,人们需要什么,厂家就生产什么,人们的投入越大,得到的相应回报也越大;但现实世界不是,我们不知道人们的需要是什么,需要用市场工具去挖掘与检验,用金钱去引导、去更新、去淘汰。就像股票市场,虽然真正意义上的钱不能生钱,但是资金的流动却使得其他的生产力得到了激发,从而使得钱能生钱。因此,非技术问题中,一部分问题是好的问题,这部分还是主要以市场为主,影响产品走向、技术发展等;还有一部分是坏问题,它们往往由不合理的市场、体制结构造成,干扰产品与技术的发展。前一部分问题的解决者是产业领导人以及在产业中拼搏的每一个人,而后一部分问题的解决者往往是政策制定者(很多时候是制造者)。

S2.技术可解决问题

一百年前,如果有人希望能够打开网站看世界上发生的各种各样的新闻,那就是天方夜谭。因为那时候没有相关的技术。随着技术的发展,现在很多技术问题成为可能。一个现象产生了,假设技术的发展速度大于非技术问题解决的速度,就得进一步假设,技术能做的事情的闭包(唔。。闭包就是。。所有发生的与可能发生但没发生的事情的全体。。)如果包含了现在已经做了的事情的集合,那么就会有一部分事情,它们可以被完成,但是尚未被做出来;如果你做了其中的一部分,你就用现有技术解决了一个没人解决过的问题,更进一步,如果这个事情是非技术问题中所谓的市场所需求的,并且配上了良好的推广等,那么你很可能就因此发家。这个现象或许是很直白的,甚至不需要那个前提假设,因为人们用现有技术解决未被解决的问题是天天都在发生的事情。为了后面更好地“调用”这个现象,给它起个名字吧,好,就叫“术闭包原理”吧。

在IT领域,可以更具体的说,什么是技术可解决性问题呢?这些问题往往可以很容易用离散数学结构来建模,容易到你都可以忽略建模这个不步骤。比如,我们要写一个音乐播放器,那么,由于相应的编码解码器技术已经被人解决了,我们可以直接用这些接口去做播放器,要考虑的问题可能是用什么结构来保存播放列表、如何找到一个音乐文件、如何读取音乐文件中的每一帧送到声卡等等。再比如,如果做数据库的索引,用什么结构来保存呢,线性表?B树?B+树?等等。归结起来,可解决性技术问题是那类问题,是利用计算机的离散结构来解决已经被离散建模的问题。当然,这是现状吧,往前推三四十年,很多离散结构的问题都没有解决情况就不大相同了,现在当然也有没解决的离散结构问题,但已经少很多了(那什么问题多了,见下面S4)。最后说说人与技术可解决问题吧,其实,解决这些技术可解决问题是很happy的,如果其他条件满足,真是一举多得,一路走向高富帅的一步,远的说,马克.扎克伯格,如果认识的话,就应该知道当年他做了一个网站——facebook(这。。没什么技术难度吧。),今天就上百亿身家了,近的说,你如果有智能手机(爱疯、安卓,whatever)的话,你完全可以自己写程序来做什么控制空调、电视、冰箱什么的,或hack一些其他功能,做出来肯定high啊,不管赚不赚钱,这在技术上是可行的,就算难但不是什么不可能。所以,做做技术可解决性问题是很怡情的。但,还是别忽略那个知识增长的指数趋势,要做到方方面面的技术可解决性问题是很难的,再加上技术上的后浪推前浪,因此还是会有不少局限,长期只解决这种问题,如果不能够像马克一样发财转为企业家或管理者,那很容易就会被后浪拍死在沙滩上。

S3.技术开放问题

相比于技术可解决问题,技术开放问题,在你开始解决的时候,就没有什么保证了。还是用那个“技术闭包原理”来解释,也就是说,你要解决问题,不在当前的技术闭包中,你要解决这个问题,就需要推进技术更近一步。这类问题有什么呢?典型的有人脸识别、语音识别(甚至是下一个S4.理论开放性问题中所描述的问题)什么的、或者IPV6与IPV4完美融合问题什么的。要解决这些问题,需要开发一些新的技术。实际上,从技术可解决问题到技术开放问题并没有太本质的区别,它们很大程度上都是市场驱动的,而且都将立即返回到市场中去。因此它们的执行载体或者说解决这些问题的主要团体往往是大大小小的公司。对应于S2中最后的问题,也就是如果长期做技术可解决问题而没有取得很好的成果(市场认同等),很容易被长江后浪拍死,但是如果在其中加入技术开放性问题,那么,就能在技术这条路上走的更远,更能够保持青春。

S4.理论开放问题

在IT领域,有一类问题,是目前还难以用计算机的离散结构来解决的。比如如何让计算机具有创造性思维、,如何让计算机明白自然语言的含义等等。这些问题之所以不是技术开放问题(肯定更不是技术可解决问题了)的原因是人们暂时还没有很好的离散计算模型,而现在的计算机需要给予这种模型来运作。我们可以告诉任何一个正常的人,告诉ta记住我,我明天再这个同一个地方找你,ta是能够明天来到这里然后认出你,但是,计算机就很难了,就算正面认出是你,你侧个身它就不认识了,它看到的是一堆像素点,具体的含义并不理解,如何让它理解,需要一系列模型。反观传统的离散结构,基于那种IF..ELSE..可以描述的离散数理逻辑,它们非常直接的吻合了计算机的离散结构。

(本段都是我的“胡说”,因为那种话看起来应该是在这个领域混了很久的元老级人物说的)我觉得,当前,在IT领域的理论开放问题中最主要与最重要的算是人工智能的问题。这些问题尚且没有理论上的或者说连续数学上的可靠解,还没有办法全面进入技术问题阶段(我相信这个流程已经正在进行,理论上逐渐成熟,技术上慢慢开始发展,不久将来或许就会大举融入市场)。对待这些问题,传统的人工智能学家的思想是直接用离散结构给问题建模,比如基于数理逻辑的推理、电脑下棋、专家系统等,仍然用的是很离散结构的方法去解决人工智能问题,后来,发现这种思路越走越路越窄,能解决的问题太少了,而另一方面,语音图像是大量数据构成的、网络的发展也涌现出很多数据,基于数据驱动、统计理论支撑的智能计算渐渐发展壮大,到现在已经火到在出国留学申请上都反应得竞争非常激烈的情形(典型代表就是机器学习及其应用)。从这个发展的趋势也可以看出来,其实在学术界,思想还是很重要的,因为解决问题的思路的发展是具有很明显思想划分的,如果抓到正确的思想好好做下去,最终是可以获得很好的结果的。

总的来说,理论开放问题,仍然需要用数学模型去描述现实问题,让那些问题首先连续数学可计算,然后再考虑用计算机去计算。这里也不多说了,用一个问题结束这个section吧。你或许心中会有这样一个我曾经有过的疑问:有些东西,比如人的感情与审美,哪有什么固定规则可循,怎么计算呢?这个问题,从另一角度来问或许会更合适:有些东西,比如人的感情与审美,有什么人们尚未找到的规则或机制在控制呢,如何找到一个合适的计算模型呢?

Conclusion

在这篇随笔中,我写了自己对于IT领域的一些小思考。我认为这个领域中的问题结构主要有上述四种:非技术性问题、技术可解决问题、技术开放问题与理论开放问题。事情的解决往往是这样的,一些看似简单的问题一开始被描述成理论开放问题,然后被连续数学建模,进而转换成离散数学结构,然后推向技术开放问题,技术开放问题或容易或困难的解决了离散数学结构的实现,进而以技术可解决问题的形式根据非技术问题的推动与限制将一个个功能推向现实,最终改变人们的生活、改变了世界。虽然其中蕴含许多令某些人激动的创造性的工作以及令某些人激动的巨大商机等,然而,对于相关的从业人员而言,一个不幸的消息是,这个巨大的领域对大多数人还是细致分工的,能够在每一层都通吃的人极少(我所知的就斯坦福的现任(或前任)校长,那个发明MIPS机器的人,还有李开复也算半个吧,他在理论开放问题上的建树是用统计方法做语音识别等,但是开复老师的编程估计就不如那些微软百度的工程师了),但是大多数人来说,往往只会集中在一两层上,第一层是一类,第二三层是一类,第四层是一类,三类要求的知识与能力结构很不相同,因此,从业人员还是要选好自己的方向,规划好自己的路线,才能更好积累自己的优势。

Reference:

[1]晓说:高晓松谈美国医疗制度

(出处:chentingpc.me

(9个打分, 平均:4.44 / 5)

雁过留声

“IT领域问题结构解析随笔”有19个回复

  1. abel 于 2012-06-01 11:36 下午

    我对人工智能问题的一点个人看法

    人工智能问题,现有的计算机体系是无解的.

    我的看法,有一个假设(大前提):不同的系统,不会具有完全相同的功能,最多二者有交集.电脑只能解决个别问题,无法完全代替人脑运作.
    即,只有相同的系统,才能做相同的事情.电脑要想实现完全的人工智能,只能像人脑一样构成和工作.

    电脑与人脑的差别如下:
    1\人脑基于模拟信号,电脑基于数字信号.电脑做模糊判断本质上还是靠蒙.
    2\人脑是编码计算存储一体化的,电脑是分开的.人脑与电脑的工作模式完全不同.
    这方面的一丝亮光是”忆阻器”.这是一种相对而言比较类似人类神经元工作模式的电子元件.
    3\人脑是浑沌系统,电脑是有序的逻辑系统.混沌系统什么概念呢?举个例子,同一商品定价2.99元与定价3元会导致销售结果的巨大差异.
    4\能量约束.人脑的混沌系统是巨量神经元之间复杂的大量的点对点连接的结果.人脑中唯一的起着总线作用的结构,是左右脑之间的胼胝体.
    这么复杂的结构,每天消耗的能量也就几个馒头.如果神经元都是耗电的,要多少电能?

  2. hh 于 2012-06-02 3:58 上午

    人工智能现在主要方向对信息做更高层次的处理,更好的辅助人类,
    要用电脑替代人脑是民科的主要研究方向

  3. chentingpc 于 2012-06-02 7:52 上午

    @abel:需要的只是一部分功能,不一定要完全取代人脑,更不一定要跟人脑相似。道理很简单,人们看到马能载人拉物,但并不是发明了一个跟马一模一样的车;人们看到鸟能在天上飞,但并不是发明了跟鸟一样的东西来空运人物。

  4. 别写这种浪费眼球的东西了 于 2012-06-03 1:44 上午

    拜托,别写这种浪费眼球的东西了,咱们干技术的,捞点干货最实在,是吧首席

  5. 楼主从业才不到3年。。。 于 2012-06-03 5:44 下午

    不到3年,有如此总结不错了。

  6. Leon 于 2012-06-04 5:09 上午

    写得相当不错,比较深入。

  7. 为什么我的回帖被删 于 2012-06-05 2:08 上午

    前几天发了个帖子,主要是觉得这个帖子很水,没有一点干货,总共大概20几个字吧,这样的发言为什么被删掉?

    这篇帖子挂了好几天了,有几篇回帖?不正是因为大家都觉得没什么好回的吗?

    首席不是讲究up and down吗,这篇帖子都up到云端了,弯曲不是哲学论坛吧。

  8. bend,or 于 2012-06-05 10:46 下午

    不知道你在说什么,讲究up and down是什么?

    首席是个多面体(手),我看到的一面是首席其实是支持多元共赢的。

    这篇文章很不错,很深刻,很有味道。有很多值得深思的地方,各取所需罢了,找不到闪光点是你的损失。水在哪里呢,是岔到医疗制度还是美国国会拉布?

    弯曲有技术,还有创业,其中创业里面不乏经营哲学,创业之道,也有不少是谈人生哲理,处世之道。他们是在分享经验,不应该拍死的。

    to 楼上:no offense, 我只是发表一点自己的看法,我是希望弯曲能热闹一点,活跃一点,但不希望TA火起来,不要让坛子里的的过客侠客有引用鲁迅围观论揶揄的藉口。如果同时能多点干货当然也不错,但干货很值钱,免费的就不多了。

  9. kevint 于 2012-06-05 11:12 下午

    务虚文章,把刚看完的晓说最新一期也给硬塞进去了。东拉西扯,没什么营养
    作者本来就没说要解决什么问题,“IT领域问题“本来就是个不存在的问题,就更不用谈怎么解决问题了。

    anyway,有人喜欢务虚,扯淡有理,务虚无罪,偶尔务务也无妨。。。

    另,那个发明MIPS机器的老头叫john hennessy。搞系统的拼不出他名字来该打。。。

  10. bend,or 于 2012-06-05 11:29 下午

    上下文中的“问题”应该是issues,而不是problem 更不是question

  11. kevint 于 2012-06-06 1:00 上午

    issue俩意思,一个是problem,一个是扯淡。我说了这篇文章是务虚扯淡的。。。

  12. bend,or 于 2012-06-06 2:01 上午

    关于文章的定性我也不争了,弯曲也有撇风的时候,要论扯谈,存储专家的一篇杂谈,看了想吐,而这篇文章没有令我反胃,原因可能是看过之后引发了一点点思考。有没有营养那是硬实力,当中如有疏漏,便是硬伤;引人深思则是软实力,思考过后,或有些许收获,或把问题看得更清楚透彻,可以理解为反刍咀嚼,帮助消化,更方便吸收。首席和理客就是这样一对,一个硬实力,一个软实力派。首席IQ数一数二,论知识,论背景,非我辈可以望其项背;理客EQ爆灯,术业有专攻,时不时来几句点睛复评让你有如醍醐灌顶,他对人生哲理,对商业之道理解深刻,时常一语道破天机,值得细细品味。

  13. 几楼楼长 于 2012-06-06 7:03 上午

    这写的。一句也没用看懂。太打击我士气了。

  14. soarsky 于 2012-06-06 10:04 下午

    这种文章挺好的啊,,,天天搞技术着眼于一个小点,久了容易脱离现实变得狭隘,还是需要停下来放在大环境思考的。。。

    十分人生的话,七分道、三分术,,,当然,这是我的个人观点。

  15. 336 于 2012-06-07 7:06 上午

    写的挺好的,上一朵鲜花

  16. 流星 于 2012-06-08 9:43 下午

    空无一物。
    人工智能本来就有基于规则(top-down 演绎)和基于数据(bottom-up 归纳)的,本身并不矛盾。系统的不完全性是由于规则的有限性导致(哥德尔定理),而非其他原因。

  17. anonym 于 2012-06-09 2:53 下午

    赞同1楼abel. 话说abel是个数学家呢.
    人工智能, 照人类现在的水平还早着呢.
    以技术见长的文章不多, 但是首席也别老是发这样的凑数啊….

  18. abel 于 2012-06-09 9:42 下午

    我不是数学家.

    此文不是陈怀临所写.作者是chentingpc.

    另外,最近看到一个关于人脑神经网络内部结构的文章,看了配图,对于人脑又多了一份感性认识.推荐:
    http://it.sohu.com/20120606/n344848780.shtml

    我想所谓人工智能,无非是让电脑做一些稍为复杂点的简单脑力劳动罢了.虽然我不懂哥德尔定理,但是我在百度百科”哥德尔定理”词条中找到了关于人工智能的段落,其表述能够支持我的看法.
    不当之处欢迎指教.

  19. 路过 于 2012-06-13 6:34 下午

    从技术角度和设计的角度看问题,区别还是非常大的。建议作者看看《乔布斯传》。