淘宝网内核开发团队盼寻有缘分的在校实习生
作者 网络菜鸟 | 2011-11-19 10:11 | 类型 中国系统软件, 互联网, 工作机会 | 35条用户评论 »
淘宝内核组是一只非常年轻的队伍,我们作为开源社区和淘宝的桥梁,一方面基于淘宝的工作负载来改进Linux内核的性能和质量,另一方面也将开源社区的新想法引入到淘宝的操作系统运行环境中。我们在不断改进Linux在淘宝成千上万台服务器上运行的性能和稳定性的同时,也持续努力将我们的工作反馈回开源社区。 关于淘宝内核组的简单情况介绍,可以在这个wiki页面看到:http://kernel.taobao.org 对于我们在内核社区的一些还很初级的工作,在这个wiki页面有一些简单的数字:http://kernel.taobao.org/index.php/Documents/kernel_development_at_taobao 我们和国内、国际的同行一直有紧密的合作,同时我们的工作内容对开源社区也非常开放。在这个小团队工作,可以同我们一起体验如何从线上运行的上万台服务器的实际运行数据中寻找可以改进Linux内核的想法,然后付诸实践并通过实际运行数据来验证自己的工作效果,并最终将代码反馈回内核社区的这个过程。 如果你是在校的学生,对系统软件开发有一些了解,而且有热情投入到Linux内核开发的社区中来,也许你可以考虑加入到淘宝内核组这个小团体中来进行实习工作。我们是非常年轻的团队,但是我们是勤奋、认真和努力的一小撮人。 实习的工作地点在杭州或者北京的淘宝办公室,根据大家的意向而定;工作时间要求不短于3个月,每周不少于3天。我们的实习工资很平常,够路费和伙食费。只是希望在这里做过实习工作的同学以后回忆起这段经历会依然感觉很开心。 欢迎有兴趣的同学发邮件到 bosong.ly 在 taobao 点 com ,希望我们能够有缘分在一起度过一段值得回忆的时光。 P.S. 如果同学们毕业之后,不论是否加入淘宝的工程团队,只要能够兴趣参与到Linux内核开发和开源社区中来,这个实习生计划就是成功的。 | |
雁过留声
“淘宝网内核开发团队盼寻有缘分的在校实习生”有35个回复
购物就上淘宝。不知道以后还有机会没。现在暂时实习不了。
淘宝和腾讯终于知道赚的钱应该花出去,这个简单的道理了。
有缘分?!
为何是实习生?技术平平的恐怕也不需要吧。
有缘分:技术不错+愿意当做廉价劳动力
缘分,亦作缘份,是中国文化和佛教的一个抽象概念,是一种人与人之间无形的连结,是某种必然存在的相遇的机会和可能。
在一起工作几个月,能彼此对上眼,不觉得是浪费时间,还觉得开开心心,确实是需要缘分。
貌似很有成就感啊 难道我还年轻 仍然追求激情?
http://kernel.taobao.org/index.php/Documents/kernel_team_members
一批小朋友的照片???
首席:我们这个团队成立也就不过1年多,很多人都是刚刚起步的新手,我们做的工作,相比行业内的同行来说,从深入、广度和价值上而言,也都非常初级。所以确实是一群小朋友 ^_^
正是因为大家的爱护、支持和鼓励(譬如首席您还周末离开家人,肉身传道授业解惑),才让我们工作的更开心,更享受。
淘宝的童靴,搞个Linux账号给我好不?兼职免费搞一阵;
认真看了一下,都是死链接啊!
@lenky0401: 不知道你说的死链接是否是对remword.com上的那些个?如果是那些链接的话,很可能是因为大墙的原因。。。。
不是哦,而是有些链接不正确,出现404,比如:我们只做了一个磁盘块访问统计工具 —>
, 404 Not found
You can try with:
All projects
@lenky0401: 发现原因了,因为引用的网站改版了,将项目的地址URL更改了 -_-! 我将引用代码网站的URL都修改了,希望没有拉下。谢谢你的提示啊 ^_^
杭州的是否在文二路西湖国际上班?
今年去过你们那边的研发中心,见的是JINX是你们想找你们搞个数据中心的交换系统来着,结果去晚了,你们东西一年前就已经弄好了。不过想不到你们竟然跑到这里来招人了,可喜可贺。
另友情提示一下,淘宝的办公室文化还是可圈可点的,比华为ZTE强的多,个人感觉甚至比企鹅也好不少。
问个问题. 贵团队是不是类似 百度系统部. 重点侧重linux内核在 文件系统 磁盘IO 网络方面的 提升?
用各种 数据库 文件读写 网络 WEB服务的benchmark跑一跑测试Linux各个内核子组件的性能,在此基础上修改Linux内核? 我感觉这种Linux内核性能及可伸缩性的工作最好交给IBM的技术专家. 国内也就吴峰光这牛B人有贡献.
你们能改哪? page cache替换策略? 异步IO性能? epoll? sendfile ? NPTL线程库? block调度器?OOMkilerr? 内存大页面?
我觉得国内的这些 XX系统部 能不能搞出啥东西啊
@awei 互联网企业修改内核,是为了解决其自身在应用linux时面临的问题,IBM修改内核,可能也是解决其自身或是客户使用LINUX时面临的问题,并无本质区别;从我看到的团队工作来看,完全可以改出来;
国内互联网企业团队可能初期水平低点,但只要有心去做,代码写得笨点,实现麻烦点,但还是能解决不少问题的;
同意julang3的,linux本就是基于互联网上网友共同参与才发展起来的,只要大家都参与进来,一定会有很大收获的。
@awei 你这种看法很片面 这些互联网公司是IBM/Intel的超级大甲方,后者做的事情是总结前者的需求而得到的,绝对不是凭空干想出来的,后者搞那些东西最终目的是为了卖机器给前者,是为了赚他们的钱。事实上OTC非常想得到的就是这些来自于大用户的真实需求到底是什么样的,而挖掘出来可以做的点绝对是需要很多努力才可以的。
夸张一点说,淘宝、百度、腾讯、Google想要什么,“吴峰光这号牛B人”(绝对没有针对个人的意思,就是个代称,别误会)和“IBM的技术专家”就得去干什么。不尊重客户的真实需求,关起门来自己玩系统软件在现在的市场环境下绝对绝对是死路一条,除非你是烧着国家的钱在大学里胡搞的。
@awei
“你们能改哪? page cache替换策略? 异步IO性能? epoll? sendfile ? NPTL线程库? block调度器?OOMkilerr? 内存大页面?”
都是些很牛B哄哄的词儿嘛 你对这里哪个小词儿敢说深刻理解了?
如果你不考虑它们是怎么用的,什么情况下适用,什么情况下不适用,不了解提出这些东西的动机是什么,不去测量对比它们在具体应用里的量化效果,你永远没法深入下去。
光看某些牛B人士搞出来的最终结果,看看patchset,是很肤浅的。
大数据+大集群就是这些在互联网公司搞系统软件的人的优势,他们比他们的乙方供应商更贴近真实需求。
@awei
“用各种 数据库 文件读写 网络 WEB服务的benchmark跑一跑测试Linux各个内核子组件的性能,”
跑这些有啥意义?他们有真实的负载,不关心这些benchmark。
wensong不在taobao了?
benchmark是系统优化的基础数据,如果真实负载性能提高而benchmark没提高,那多半是你的应用优化有问题。每个公司的公益事业还是有其功利性的,IBM玩linux开源是为了对抗微软、推广他的软硬件解决方案、树立高端形象;而淘宝玩linux开源还没达到那个层次,主要是为了使淘宝的基本系统平台融入linux社区,别kernel一升级他们也得忙着个更新代码打补丁,从淘宝因linux获得的收益和其对linux的付出来看,淘宝肯定欠很多债。
供应商和客户谁的水平更高,需要在一个重量级的对手上比,同一重量级下,水平不会差太多,一般来说,可能供应商略高一点的可能性略大些
错,benchmark是在没有真实负载可用或者不能预测会有什么样的真实负载时不得已的权宜之计,如果你已经很清楚地知道自己的系统是为什么东西服务的,手里有这个环境,benchmark就没有任何用处。
建议仔细读一下计算机体系结构量化研究方法中对于benchmark的看法。
“benchmark是系统优化的基础数据,如果真实负载性能提高而benchmark没提高,那多半是你的应用优化有问题”
这是什么逻辑?这显然说明benchmark有问题!
“而淘宝玩linux开源还没达到那个层次,主要是为了使淘宝的基本系统平台融入linux社区,别kernel一升级他们也得忙着个更新代码打补丁,从淘宝因linux获得的收益和其对linux的付出来看,淘宝肯定欠很多债。”
您太看得起linux社区了,没有任何一个互联网公司跟着upstream社区走,很多公司用的还是非常古老的内核,绝大多数是rhel5u4,说红帽一升级他们忙还差不多。upstream kernel他们根本不care。有用是根本,那些人是注重实效的,搞这些更多的是为了解决自己的问题,特别是各种性能问题。至于欠债之类的,就更荒唐了。建议你先查一下国内互联网公司在upstream kernel里提交记录的排序,淘宝比百度和腾讯强多了。不过话说回来,这根本不说明任何问题,淘宝爱提交这只能说明他们有那么点空余时间爱搞这个,看他们的提交记录,我还真不相信那些东西都是他们工作中用得着的。另外两家闲功夫更少,没时间玩票。
都别吵了。。。弟兄们利用马云同学的银子,做开源的事情。这就是贡献,是智慧!请keep doing so
内核算法,本质上无非就是个工程,不和实际应用相结合,肯定是无法发挥最佳性能的。
实际生产系统性能的提升和benchmark提升不是一个概念。benchmark提升而生产系统性能不提升的例子到处都有;生产系统性能提升了,benchmark不提升有什么关系。
这又到了另外一个话题,不是所有对内核的修改(定制)都适合提交patch的,要整合进去的是公用的东西,对鲁棒性要求很高,很多定制的优化是不适合加进去的。
回一下awai在15楼的问题:百度的系统部的同学们,和我们都有很密切的合作。他们的工作开展的很早,对系统和应用的理解非常深刻,而且他们做的不少工作,实际上比upstream要开展的早很多。这些同学的工作深入和广度,都是值得我们好好学习多年的榜样。
技术是为业务服务的,没有需求的技术,看不出来有什么存在的必要。
真羡慕taobao系统部的兄弟们,拿着工资,还能干自己喜欢的工作!
TO 22 楼comments :
你的观点我非常赞同,内核是为应用服务的. 包括这些技术的提出其实都是有根源的. 比如(异步IO性能,epoll,sendfile ,NPTL线程库)可能都是需要构件一个高性能网络web服务器需要关注的技术. 至于cachae的预读/替换/写回 那更是经典的话题. linux是通用操作系统,即要满足桌面也要满足服务器,有时候它会做一些折中的考虑. oomkiller的机制肯定不是一个通用的机制, android操作系统不可能让oomkiller干掉自己前端的显示进程. 百度需要的oom也不想干掉自己的关键业务进程.
单纯的研究linux内核,不了解应用的需求真没多大意义. 关键在于能够提出牛B的需求(提到点子上,而且通用),你才知道怎么给内核动刀子,有没有意义.
真羡慕你们taobo的兄弟,拿着马云的银子,还能搞自己喜欢的工作和女人.