过年回家正好前两天有点萎靡不太想学东西,来整理整理写一写25年的年终总结。
今年事比较多,不过大体还是就两大块,工作,生活,还有一些其他小的思考(没空单独的写文章,就一起挤到年终总结里来)
工作
GraphRAG
今年最核心的点了,整个人的工作重心从之前的存储引擎变成了GraphRAG,一个新的项目。
主要感谢老板的认可,给我投了很多的人力,并搞项目的时候给了很多帮助,让我也SFT了一把,学习到了很多新方法。
当然也要感谢GraphRAG小组的同学的支持,接业务,日常运维开发都比较辛苦。最后感觉结果还不错,虽然没有呈现一些热点一样的爆炸式增长,但是也算是一个不错的产品在日常接入业务,也有一些核心客户了。
一时半会没有打好大纲,我就大概说说一些总结经验吧。我感觉主要分四块:
* 首先是找到用户,比如通过一些宣传手段把自己卖出去,或者是定向的找到有需求的用户,针对性的做服务。
* 然后是产品能力的构建,一个是尝试构建产品的护城河,第二个则是如何说服用户来使用我们的产品。
* 第三个是日常的维护,对内的话是做一些运维,对外的话则是维护和用户之间的关系
* 第四个则是团队的维护,协调大家进行开发,共同对这个产品负责,同时可能也考虑一下每个成员的诉求,提高一下大家的主动性。
找到用户这个事,我现在也觉得把握不太住,从这一年喷发出来的AI产品(无论是公司内还是公司外)来看,有的看起来挺牛逼的,最后也没有什么声音。有的看着平平无奇却又有比较大的影响力。而且现在大家的注意力被各种爆点吸引,很多项目都是出来火一下就结束了,无法持续的吸引大家的注意力。
所以这里我也不清楚如何通过宣传手段把自己卖出去。我们走的路线更多的还是第二种,定向的找到有需求的用户。
这里我感觉一个经验就是,很多用户的需求是类似的,但是并没有人帮忙总结一些常见的best practice,作为底层服务的提供者,我们可以深入了解一下业务需求以及方案,从而把一个业务的经验迁移到另一个业务上面,以帮助业务的视角来尝试使用我们的产品。
实际一点,就是多和用户聊一聊,像同事一样去聊,多关注关注一些细节,一来可以尝试挖掘更多新的场景,二来则是可以对这个行业的生态了解的更好,提高自己对于这个方向的认知(我倒觉得这个算是一个护城河)。
然后是产品能力了,这一年早期我就用AI帮忙写了一个工具,可以抓取一些paper(主要是arxiv上),帮助进行总结,可以根据主题进行筛选。主要的目的就是希望跟进每一个方向的进展,帮助我了解目前的研究趋势,以及尝试应用一些比较新的技术出来。
这里我觉得确实是又一些效果的,比如我确实可以掌握到大方向的趋势,比较明显的就是R1出来之后,RAG这块的研究趋势从25年上半年的各种trick,发展到了后面基于RL的各种方法,尤其是在search R1相关工作出来后。
同时时效性也比较明显,一般来说一个paper从发出来,到他真的成为爆点,都会有一到两周的时间(我的观察),如果这个时候我们可以识别出来关键点并快速应用,趁着爆点也去售卖一下我们的产品,应该也有乘东风的效果。
* 比如印象里search R1出现后,到成为大家讨论的方案,中间大概过了两周(印象不是很清了,我只记得这个paper code的阅读任务在我的todo list里挂了很久)。当时也确实发现了他的闪光点,如果这小段时间内我们可以快速应用技术到我们的产品上,比如GraphR1,就可以趁着SearchR1的这一波去发一些文章售卖一波。
除去这个小工具外,这一年做AI应用最大的体会就是要跟着模型能力发展了。和bitter lesson一样,要设计能够scale的算法,AI应用也是,要设计能够跟着基模能力发展的算法。虽然年初开始做的时候我就知道这回事,但是真做起来,发现基模能力的提升能够轻易战胜我们之前在上游做的很多工作,还是又一些沮丧的,这也为我后面工作的调整贡献了一些权重。
woc写到这里发现写细了好累,不行我要简写了。
第三块是日常的维护,这块主要就是和一些核心业务维持好关系,和第一点有一些类似,和合作的业务方吃吃饭,聊一些技术细节等。可以探索新的方向,同时也是避免业务跑路。
对于产品来说,日常的维护主要回答业务问题,做运维。这些事情主要要考虑的就是能否scale了,项目早期业务少,重心在其他方面的时候,这块可以少考虑一些。随着项目扩大,业务逐渐变多,就需要看一看是不是有一些重复的工作可以提效,以及是一些问题可以避免了。
最直观的就是文档了,这一年我的一个体会就是写文档很关键,当然说的并不是要写好看,而是把规则,一些问题归纳到文档中,让文档run起这个项目。
从这个角度说,文档是code,而项目的成员则是cpu,执行文档中的内容,并持续维护文档,让项目可以沉淀下来,而不是随着成员的记忆而消散。
同样文档还有一个好处就是一写多读,写一次可以很多人看,大幅度降低回答问题的成本。所以基本有什么问题我回答了一次以上,就会主动尝试把它沉淀到文档中。
第四个是日常团队的维护。项目启动的好一段时间(可能半年多),我感觉我都是以独裁者的模式来运营这个项目的,对每个细节抠的都非常细,每一个代码也都是我来review的。
* 好处自然就是我可以对项目有非常细致的把握,single master,没有通信成本,我可以把项目的上限抬的比较高。项目可以随着我的认知而发展。在加上我日常会高强度关注业界的状况以及业务的动态,确实早期对项目发展是正向的。
* 坏处有两点。一个则是组织架构上的,这种发展模式很明显瓶颈在我身上,一些关键的决策都需要我来做。后期我burnout之后,明显我就感觉项目的发展变得迟缓了。第二点则是涉及到团队成员,有的同学可能比较适合这种接受比较细碎的任务并执行的角色,有的则更偏向自己做一些大块的方向。这种独裁者模式会降低大家对项目的掌控力,因为自己无法做决策,从而导致缺少owner意识。
* 当然这里我认为是对于大多数人适用的。应该还有少部分选手会自己找任务,负责模块的。
所以到后期的时候,还是主动的把一些大块的工作分发给大家,同时一定程度上降低预期,这里需要忍住自己上手的冲动,让大家自己去试错,去成长。目前看的话,转型还算成功。
总的来说,我感觉项目早期比较适合独裁者模式,快速迭代一波后,就可以考虑放手让大家做了,放手也是一个关键的事情,需要能够容忍短期的inperfect。
然后日常和项目组的同学进行沟通,了解大家的诉求也是比较关键的。比如可能有的同学希望做一些花活,有的希望负责点大块的东西,就可以考虑按需调整大家的工作,也是激励大家工作的一部分了。
工作状态
graphrag项目本身的事情说完之后,上面也一定程度上引出了我说的burnout的问题。这里主要谈谈这个。
大概在Q4后半段的时候,项目的大多数工作都已经完成并release了,同时也接了一波新的业务。不知道是什么原因,我感觉突然自己丧失了行动力,对项目中的工作提不起任何兴趣,撑着我走下去的可能就是带起这个项目的责任感,即便如此工作效率也大大下降了。
一来可能是因为进入了年末的阳痿期,紧绷神经干了一年,年末突然事少了就放松下来了。第二点也是因为那个时间受到一些影响,对大模型相关的工作有了一些兴趣。
影响的话大体上还是之前在Q3总结中写的,就不多说了。
当时感觉更多的还是burnout,一年的时间基本没有什么放松休息的时间,前半年也基本都在加班。周末的时间不是在写代码就是在读paper。用力过猛之后,突然停下来,就很难再把弦绷上了。
同时也感觉到这个项目并不是我最开始想的那样的项目,到老板的层面感觉也是可有可无。
总之是很多的问题结合起来的,最根本的原因是希望投入大模型方向,而GraphRAG这个不再能满足我对这块的需求了。最直接的原因则是长期的疲惫。一年下来人是麻木的。这就引出了我后面的切换工作的事情了。
切换工作
虽然这一年的时间,我多次在想自己可能不会被吸引到转方向(可能来自于对项目的责任感,或者是对团队),但是上面burnout后,我认识到自己需要作出调整了。
我尝试投了一下简历,但是很快就被拒了,因为背景差的太多了,我也没什么能拿出来手的项目。
因为之前学了cs336,对大模型这块也算是有一些基本的认识,我开始阅读分布式训练相关的代码,主要就是torch/megatron,后面还涉及到dataloader的一些,以及deepspeed,torchtitan等。
也许是年轻,或者是感觉简历被拒触发了我挑战的欲望,我的热情很快回来了,大概一个月的时间(不包括上班),我把megatron/torch相关的代码全部研究完并发布了一些文章,同时阅读了大量的论文来补充理论基础。
后面就是面试,也比较顺利结束了。过程有点流水账。。
这次也是我的第一次换工作,还是跨了一个比较大的方向。对我来说最关键的就是跨大方向的经历,因为我比较信奉七年就是一辈子这个事,一个事情干通关了就要切到下一个事情,我不希望校招的时候选择了数据库,就永远都是干数据库了,我希望做的大方向可以持续的切换。
目前看,校招的两年做了存储引擎,第三年做了GraphRAG,第四年则是来搞AI infra相关的,切换的速度我个人认为还是比较快的
既然领域内的知识可以转起飞轮,跨领域应该也可以。对于这个新方向,我希望可以在一年内转起飞轮,在两年内对行业有比较全面的掌握,在这之后,可能再换一个新的方向也说不定。
还有一个就是切换新方向的学习经历了,简单说就是持续投入精力,给自己信心持续学习就好,不要怀疑自己。我在尝试学新的方向的时候也是处处怀疑自己能否跨领域成功,刚开始的一段时间肯定是各处碰壁的,再加上网络上各种信息,很容易就被焦虑感吞噬,进而影响自己的状态,怀疑自己。
我感觉这块就是傻学就好,一步一个脚印,记得这是自己的长跑,自己坚持就好。
至于新的方向的话,到新的团队体验了一些感受到还是有差距的,不过还是要保持信心,保持谦卑,保持努力,继续加油就好。
生活
25年结束就25周岁了,虽然感觉上还年轻,但是一年的工作下来人的状态确实不太好了。体检有一些问题,体重也变大了。没能保持24年的健康状态。
运动
运动上主要就是乒乓球和羽毛球了,感觉体重增加,同时运动频率降低后,这两项运动的水平还是有影响的。虽然还在打,经验带来了一些运动技巧的提升,但是身体素质,动作的感知这块很明显变弱了。
而且这一年也开始有睡眠问题了,有的时候晚上会因为焦虑等问题睡不着,或者起的很早。
26年随着工作的调整,要把自己的状态在调整回来。
阅读
阅读上的话,学术paper倒是读了不少,尤其是GraphRAG方面的,还有llm方面。
闲书读的少了很多,印象比较深的就是近期在读的奇幻作品 迷雾之子。
在微信读书上看数据阅读时长也不多,也需要在26年进一步调整。
cooking
25年倒是继续做了不少饭,解锁了挺多新的菜单的。而且随着做饭次数的增加,也逐渐感觉到一些调味的门道了。
这块可能要系统性的学习一下
26年继续加油吧
游戏
游戏的话,25年通关的都是很短的游戏。一些大作都是玩到半吊子。
而且我感觉自己对rougelike的容忍度已经变得非常低了,因为一些新游戏需要投入一些时间才能获得反馈。但是这些时间我会感觉到希望投入到关键的地方。
尤其是一些难度比较高的,可能玩两把就会想,这点练习的时间不如去运动一下,或者去读会书。
目前还没啥想法,不过还是希望26年可以通关一些佳作。
新的锚点
对应上面的burnout的问题,我希望在生活中找到更多的锚点,让工作这个点失效的时候,其他点也可以支撑住我,让我可以继续走下去。我希望继续精进现有的这些兴趣,同时探索一些新的。
比如对于做饭,和羽毛球,继续精进,上一些课,在这里也找到一个自己的小圈子。
同时最近探索了攀岩,我也非常希望,希望26年可以在这里也构建一个锚点。
其他
写到后面已经有点流水账了,最后这几个就简单写写吧。
vibe coding
我个人也算是vibe coding的重度用户了,在年中的时候用claude code写了很多东西,重度的使用了各种code agent,cursor,codex,claude code等。
同时也构建了好几个自己的ai小工具。
对于vibe coding,我的看法是这样的:
* 对于小项目,比如个人用的,或者是小范围用的,一个人可以做产品,那用code agent全面承包即可。
* 比较大的项目,需要人日常维护的,控制使用的范围,在非常模块化的位置使用。同时尽量减少频率。即便是简单的util,以及单测,也不要完全依赖AI。
* 当然,也可能有人希望让AI全面维护大的项目。自己完全不做任何的参与,这块我没这个权利,也没有这个想法。就不做讨论了
目前我对AI提效的看法
之所以上面说,vibe coding也要减少ai参与的程度。我认为我们需要控制自己使用AI提效,或者是使用各种东西提效的冲动。(这里说的有点绝对)
我认为coding这个东西,如果希望自己维护项目,是需要主动投入精力去思考的。这个思考的时间是非常关键的。
使用AI辅助coding,或者使用AI辅助阅读paper,辅助做各种事情,确实非常快,效率很高,可以快速出一个非常好的成果。这个成果可能是自己投入很多精力都达不到的。
但是这个过程缺了自己各种踩坑,投入时间思考各种可能性的过程。
这里只是我直观的感觉,我不清楚具体是为什么,只是我这一年的经历中,我自己手写的代码,一行一行读的论文,对我造成的影响更大,更容易出现connecting the dots的感觉。而用AI辅助的这些相对弱一些。
核心点在于,我认为投入的时间是关键的。阅读/coding的关键在于过程中的这些思考,而非他产出的结果。
* 阅读paper不是为了学习具体的idea,而是把paper提出的各种见解融入到自己的体系中
* coding不是为了搞出立刻可以work的代码,而是不断思考代码片段,系统的架构,拆分出来的这些模块等
* 这些可以让我们在AI时代提出更有见解的问题,更好的进行prompt,从而更好的强化自己
again,只是我的见解。而且很明显上面这些工作其实最终的目的就是有产出。只不过现在AI的能力可能还没达到我们可以完全放任不管的地步(或者换一个思考角度就是自己的认知能力必须随着AI一起提高
突然发现写作的这个过程又callback了一些新的思考,这也是为什么我们需要自己去做反思,而不是让AI来帮我写年度总结文档。这些新的点就不单独列出来了,相信后面还有很多机会可以connect the dots,到时候再展现出来吧。
(每次写到最后总感觉写的好乱。。这个更像是打草稿整理自己的思绪,而不是真的总结)
最后,再分享一下我前一段时间很喜欢的一个歌 go solo,他提醒了我自己的人生还是自己的长跑,会有其他人的帮助,但核心的动力源还是自己。所以要保持信念,享受路途,坚持下去。
文章评论