今天是2025年1月21日,严格来说是这个寒假在家的第三天了,我记得高中背过一句“家人闲坐,灯火可亲”。这个学期以来我一直是心绪颇不宁静,难得现在有点这个感觉,于是决定敲打敲打键盘。
其实仔细回想刚刚过去的这几个月,实在不是在颓靡中度过的,比起之前的大学时光,甚至可以说是宵衣旰食的一段日子,但是总归觉得自己一事无成,昏昏碌碌,现用流水账的形式将参与到AIR的过去的几个月聊表于下:
2024年的春季学期,我上了人工智能导论、数据结构这几门计算机相关的课程,又非常偶然地经过白玉琦的介绍参加了自动化系的机器狗比赛,再加上这整段时间,在视野范围内万物皆AI,所以我想就是这段时间里,我决定了以后想搞AI。
然后在一中国家地理的读者群,竟然看到李楚璇给周谷越的机器人实验室招人的消息,和周谷越草草见了一面,就被塞给了颜子柯,云里雾里的开始做起了3D重建的研究,这是加入AIR的开端。
3D重建具体来说其实是做把一个NeRF缝合到一个建图里的项目,算是第一次项目启蒙吧,头一回看那么长的代码和那么多的文件,邝子佳写的代码更是难以言表,算是非常痛苦的一段经历,我想我会深深的记得和八叉树还有SDF搏斗的那几天,Marching Cubes!Marching!
总之在上个暑假里,大概就是做了这么一个3D重建的项目,对于基本的科研项目的架构算是有了一点了解,Ubuntu和一些软件工具算是玩的熟悉了点(ChatGPT当然功不可没),大概也就是这个时候起,我对于培养方案里的课,尤其是能动系的课开始充满鄙夷,唯一使我保持敬畏之心的是概率论与数理统计,大概是因为我听闻计算机中概率是非常重要的吧,我就是这么爱计算机。
2024年的秋季学期,这个学期的前大部分都是垃圾时间,平常上课基本不去(当然后小部分上课也是不去的),即使去了也是象征性出席,由于上面提到的鄙夷,我不愿意听也听不下去,或者就刷手机刷过,或者敲自己的键盘玩自己的电脑。至于AIR这边则是一事无成,周谷越让复现李飞飞的ReKep,然而我毫无机器人控制的基础,也没有成熟的代码框架,一切都从零开始,从谷歌和ChatGPT开始。MaskTracker,KeypointsTracker,全部从零开始手写,整个的过程就是迷茫中迷茫,偶尔出现的丁恺睿和赵昊也没帮上什么忙,至于周谷越,出于尊敬或者是害怕,我不敢和他多说话。
在这个学期快结束的时候,丁恺睿找来颜子珂一起,开个会想找个研究方向,但是最终的结果是不了了之,颜子珂告诉我,具身很难做,至少在科研层面,具身写论文发论文很难,对于我这个大三马上要读研的人来说,并不合适,至少在北京不合适,要做也是去周谷越在无锡的求之科技做。这个时候我有了犹豫,是否还要跟周谷越做具身?
但是当时我的想法仍然是,寒假到无锡去,或许就能做出点成果?我和周谷越说了我寒假要去无锡,也跟李楚璇说了寒假要去无锡,直到高家思让我调MMK2,我放弃了去无锡的想法。我和贾宇飞调他的SuperStateMachine.py,一直调到凌晨两三点,无故失灵的手臂,不断的重复的在莫名其妙的BUG里调试,加深了颜子轲告诉我的具身很难的印象。我受不了,决定找赵昊,换个方向,他讲的是做自动驾驶模型,一开始提到一个有图端到端,最后定下来做Diffusion Drive的DPO。
再说回周谷越这边,知道我去找赵昊后,他感觉是很不高兴。这是有一天晚上,他不清不楚的发了我一个项目的计划,也就是微信上几行字,然后打电话问我有没有时间。我刚刚接受了赵昊的DiffusionDrive的项目,又恰逢期末考试,我回答没有并且说想先和赵昊做一段DiffusionDrive,“那就没这个事了是吧?”这是他的回答,以及那个从来没有一个人说话的群聊也被他Deal Close了,Deal Close!
所幸周谷越这边Deal Close了但是赵昊那边的DiffusionDrive Open了,这好像是赵昊和博世的合作项目或者什么,但是不重要,总之我要是一作,即使中间期末考试耽搁了一会儿,但是这一个月来我进度很快,比之ReKep时光不知道顺遂多少,已经到了调参起实验的环节了,高焕昂讲如果顺利甚至年前就能写论文了。总之,目前看来这一切都很好。
后续我想是快快把Diffusion Drive DPO的结果跑出来吧!然后快快的把论文发出来吧!之后不管怎样,有篇一作总归好办,加油!