李国杰 。《深切怀念我的导师夏培肃老师》

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享

  听到夏培肃老师不幸去世的消息,脑中立即浮现出她那慈母般的面容,35年来与夏老师相处的幕幕往事连绵不断涌上心头。一个月前,我和我老伴到病房看望夏老师时,她的精神还好,不停地问这问那,我老伴当时就说,夏老师还有康复的希望。8月22日,我和韩承德老师到中日友好医院ICU病房看望夏老师时, 她已经不能说话,眼神上似乎还有一点交流。没想到五天以后在与北京市公安局签约的会上就接到她辞世而去的噩耗。

我1978年考入中国科技大学读硕士研究生,报考的导师是郑世荣和焦桐礼老师,第一年在合肥学习数学、英语、编译等课程。1979年我转学到中科院计算所代培,事先并没有给夏老师联系。当我在计算所找到夏老师时,她欣然接受我做她的学生,并安排韩承德老师与她一起指导我,从此我的科研生涯就与夏老师连在一起了。

夏老师当时正在研制150-AP数列处理机,为北京大学研制的每秒100万次的150计算机配一台高速的浮点加速数列处理机(AP)。150-AP后来安装在长庆油田,地震资料的处理速度比150机提高10倍以上。夏老师写的关于150-AP的论文发表在1981年国际计算机体系结构会议(ISCA)上,被会议列为特邀报告,这可能是我国内地学者最早在系统结构顶级会议上发表的论文之一。

夏老师十分重视从应用实践中发现科学问题,要求我和另外两位硕士研究生先到河北涿县的石油物探中心去实习,从石油物探的计算机应用中找硕士论文课题。这是我硕士研究的第一课,我后来选择“阵列流水算法和流水式阵列处理机”(即Systolic Array)做硕士论文题目,就是从石油物探的卷积运算中发现的需求。硕士论文写完后,夏老师很满意,要求我将算法设计部分修改成学报论文。在夏老师的细心指导下,1982年第2期我的处女作“用参数确定法设计阵列流水算法”在《计算机学报》上发表。 到美国读博士以后,在华云生教授指导下,我将这篇硕士论文的部分成果修改完善成一种脉动阵列的最优设计方法——“The Design of Optimal Systolic Array”(后来被国外学者称为Li-Wah方法),1985年发表在 IEEE Transaction on Computer 上,这篇论文被他人引用了253次,至今仍有人引用。我的学术生涯从这篇论文开始,夏老师是我走上计算机科研道路的引路人,我永远铭记着硕士学习期间她对我的教诲。

夏培肃先生是中国计算机事业的奠基人之一,从上世纪50年代办国内第一批计算机人才培训班开始,她一生倾注了大量精力在人才的选拔和培养上,不放过有助于青年人才成长的任何机会。1981年,美国普渡大学黄铠教授来北京讲学。当时到国内讲学的国外教授很少,夏老师立刻抓住机会,主动约见黄教授,推荐我出国读博士学位。经过黄教授的考察,我荣幸地获得出国深造的机会,成为我国改革开放后较早出国的自费留学生。出国留学是我一生的转折点,夏老师的推荐改变了我的人生轨迹,为我开拓了学术研究的新空间,使我有机会挽回文革十年的损失,走上我梦寐以求的科研之路

阅读全文»

(6个打分, 平均:5.00 / 5)

聚云科技 。《APM的过去,现在和将来》

APM的过去、现在和将来

Xinan Tang,  CTO, ClearClouds Inc. (聚云科技)
 

随着互联网的日新月异的发展,网络上的线上服务日益增多。从搜索到购物,从发邮件到收微信,无论是使用桌面电脑还是移动终端,享受网络生活都成了我们每天不可缺少的一部分。但线上服务是否好? 用户的满意度有多高? 服务不好的原因是什么? 这些问题就要用网络应用的性能监测来回答了。Application  Performance Monitor (APM) ,应用层上的性能监测,用以衡量线上服务的综合性能,它通过衡量实现线上服务的各个环节,尤其是服务器的运行情况,来监控线上服务的质量,以便及时发现问题,保证良好的用户体验。

衡量应用层的性能指标有好多种, 例如: 某种网络应用(购物)所耗的流量,应用的反应时间,应用交付的成功率等。 我们这里就用服务的反应时间(response time)这个最重要的指标来解释APM监测的原理。从监测方法上来说,有从网络层直接入手的,Application-Aware Network Performance Monitoring (AA-NPM),以及在服务器上直接部署各类探点来实现的。我们在以下讨论中除非特殊需要, 并不加以严格的区分。

任何线上服务都是由某种云通过网络和计算资源来提供的。无论是在公有云还是私有云里,网路和服务器是实现线上服务的物理基础。当用户的服务请求通过互联网抵达云端时, 她需要立即识别服务类型,将请求送达相应的服务器,作出服务响应,然后返回处理结果。当用户请求得不到及时处理时,云服务商不但丢失用户信任, 甚至直接丢失业务收入。所以应用(服务)的响应时间是至关重要,它至少有三个部分组成:

  1. 终端的处理时间: 例如:电脑是如何发出申请,又是如何显示返回的HTML文件的? 由于个人电脑和智能手机强大的处理能力,这段时间一般不被认为是线上服务的瓶颈口。

  2. 网络传输的时间: 是指在ISP网络和云内部网络上的传输时间。例如:用有线网要比无线网络传的快。大家知道无论是那种类型的网络,都有可能出现问题。当网络传输不稳定时对上层应用的影响是巨大的。

  3. 服务器的反应时间:一个稍微复杂的服务请求至少要经过三种不同类型服务器的处理:网页服务器, 应用服务器和数据库服务器。随着线上服务的模式日趋复杂,这段时间的变数很大,这也就是APM衡量的重点。

网络传输一般也不是问题,但一旦有了问题,如何快速知道呢?Network Performance Monitoring (NPM,网络性能监测)就是用来监测网络性能的。聚云科技(ClearClouds)的云服务监控系统就兼有NPM的功能,可以认为是APM和NPM两大性能监测工具的高度集成。它能同时分析千万(10-Million)条TCP的连接,实时地感知网络的传输性能。

第一代的APM工具使用间接的方法来推断服务器的反应时间。例如,在每台服务器上部署探点,测量CPU,内存,磁盘的使用率从而来间接地估算出对某线上服务的反应时间。第二代APM产品从监测点发一些特殊订制的请求(ping, wget),用这些模拟请求的反应时间来替代实际的反应时间。国内的基调网络和监控宝,国外的APPNETA都是使用这种方法。第三代APM产品直接分析每个服务请求、直接计算其反应时间,从而更加准确地刻画了线上服务的质量。聚云科技和Extrahop目前提供这样的监测产品。聚云科技的高端产品能在20Gbps的大流量下对每个HTTP的请求进行分析,从而能有效地测量网上服务的质量。

应用层性能监测的一个重要用途是故障诊断。当服务质量不尽人意时,是哪个服务环节出了问题呢?例如:当网页服务器不断报错时,使用聚云科技的产品能通过对HTTP协议的跟踪,实时地分析出哪些网页(URL)受到了影响,由哪些网页服务器造成的,受影响的客户是谁?这样精准的定位分析为提供安全可靠的线上服务建立了保障。

但如果不是网页服务器的问题,怀疑指向应用服务器,就要用其它的监测手段了。现在的应用服务器使用Java,Python,Perl等多种语言来实现中间件,复杂的应用逻辑即有可能导致应用性能的下降也有可能引入异常的出现。对这种解释性语言的性能监控也是目前最活跃的领域之一,蓝海讯通, AppDynamics, New Relic都有相关的产品,可以用来帮助用户调试解释性语言的性能。 由于能在源代码上进行精确的定位,这些工具被这些语言的开发者们广泛地使用。

要想真正做到端到端的应用性能监测,精准定位服务故障,往往需要结合多种监测工具。假定在网络上部署了一台聚云科技的云服务监控系统, 在每台应用服务器上部署了蓝海讯通的APM探点。 当线上服务反应时间慢时,先用聚云科技监控系统的NPM功能排除不是网络传输的问题,再用其HTTP分析功能定位是那个网页服务器反应慢了。由于从网页服务器观察到的反应时间是三种服务器反应时间之和,如果网页服务器本身没有问题,下一步就要通过蓝海讯通的APM工具,试图定位是否是应用服务器的问题了。如果还不是,那么问题的根源最后就指向数据库服务器了。

应用性能监测还有其它的应用,例如做用户行为分析,识别网络爬虫和发现DDOS攻击等。由于篇幅所限,这些应用将在以后的文章中详细介绍。未来的应用性能监测产品在功能上还要进一步加强。首先要把多种性能监测功能融为一体, 形成一个完整的监测平台。第二,服务性能监测实际要包含多项指标,服务的异常要从多个维度上观察。例如:流量的增加导致了反应时间的缓慢可以用增加更多的服务器来解决;应用服务器上性能的提高导致了数据库变成新的瓶颈口就要从监测数据库着手。第三,由于它在应用层上做分析感知了应用的信息,APM应该积极地配合SDN控制器,在网络安全和网络资源管理上发挥更大的作用。

(没有打分)

360移动搜索技术负责人陈利人辞职 。去向不明

据可靠消息,360移动搜索技术负责人陈利人辞职 。去向不明。陈利人曾是谷歌美国研发骨干工程师,之后与刘俊等人联合创办社会化搜索云云网。之后曾出任盘古搜索CTO。

(没有打分)

A Few Useful Things to Know about Machine Learning

 

虽然不是很新的Paper,但是内容很棒,很多人推荐过,也比较通俗易懂

(没有打分)