2020年11月30日 11:15:31 总结一下后续。签了小米之后,接到了好未来、华为、360的oc,360不太想去就没有继续聊了。好未来是27k*15+30k签字费+100k股票,华为深圳19k。用好未来让小米给我涨了2k,和HR也说的比较确定了不考虑其他的了。再之后接到了美团web ios和字节抖音电商nlp的捞人,都拒了,秋招就结束了吧。争取顺利毕业,明年小米科技园见~

2020年10月15日 13:34:56 收到海康HR面,更纠结了

2020年10月14日 08:49:47 一个国庆假期过去offer情况没什么改变,希望好未来快点开奖

2020年9月28日 23:10:18 今天感觉大家面龙湖的体验都不是很好

实习

五六月份面了几家公司的实习,最后没有找到,日后再更面经

秋招

网易互联网-NLP算法工程师

一面

  • 项目、基础知识

  • 聊到了相似度计算提速、sentence-bert

  • 算法题:编辑距离、快排

  • 面试官是语音部门的,说自己当时也投的NLP但是不知道为啥来了现在的部门www

二面

  • 面试官像本科同学

  • 唯一聊到日语的,他说他在早稻田读过

  • 过拟合怎么解决

  • 评价如果训练一个模型,能预测对70%的训练集,拿剩余的30%再喂给模型训练的做法

  • 算法题:给一个字符串如abcdfgdfabc,要切分成abc|df|f|df|abc,求切分位置

三面

  • 聊项目,捎带问题

  • 场景题:任务型对话

结果

无缘网易,曹师兄还是强

拼多多-算法工程师

一面

  • 自我介绍+项目

  • 手推LR,过拟合怎么办,L1和L2正则

  • xgb简单介绍,中间卡住整理思路的时候直接下一问题了

  • 算法题:给无序数组,恢复成二叉搜索树

二面

  • 打开了博客,博客实现

  • 数据量

  • BERT的结构,多头attention多头干啥的

  • GBDT和xgb的区别

  • CRF,维特比算法,面试官说听起来像局部最优(是全局最优没错)

  • 算法题:并查集

  • 评价:面完了面试官说都挺好,但是没有实习经历,隐隐就感觉不行啦

结果

卸载了拼多多,不过挂了还能投,第三次投拼多多

阿里巴巴-钉钉NLP算法工程师

一面

  • 电话面,突袭

  • 随机森林,gbdt的区别

  • 分类模型都有啥

  • 新词发现你会怎么做

二面

  • 视频面,突袭

  • 常用什么Python库,说到jieba分词,底层原理了解吗

  • 智力题:ABC三个门,一个门后有奖。一开始选A门,主持人打开B门,门后没有奖,这时候你换不换门

  • 海量搜索返回的网页,如何排序

  • 多线程了解吗,Python的GIL知道吗

  • Python的字典底层实现

  • 评价:要加强基础

结果

秋招第一面,毫无面试经验

美团-自然语言处理开发工程师

一面

  • 第一次女面试官

  • 项目介绍的很详细,穿插问题,分词比较关注,没有领域词典怎么办,(领域词汇发现(凝固度和自由度),或者有数据训练分词)

  • 让我做分词的话怎么做一开始问HMM,后来转变成了CRF,开始问维特比算法的过程

  • 算法题:深度优先,找图中A点到E点的所有路径

  • 主要做酒店旅游方面,评论的情感分析,知识图谱,还有问答(偏机器人客服的感觉)

二面

  • 面试官说他老婆也是我们实验室毕业的,之后关了摄像头,体验较差

  • 介绍项目,不太感兴趣的样子

  • 算法题:二叉树后序遍历,后来说太复杂,换成了中序

  • 场景题:结合评论给景点打多标签

结果

一面还可以,二面的体验不是很好,不去也罢

BIGO-NLP算法工程师

一面

  • 介绍项目

  • 如何解决过拟合

  • 对抗学习

  • 集成学习

  • BN

  • LR的损失函数是啥

  • 算法题:三数之和

结果

返校前的最后一面,答的也不好,估计凉了,网站还没挂

快手-NLP算法工程师

一面

  • 指出简历痛点,结合博客怼,虽不爽,但事实

  • BERT的各种细节,attention理解不深入

  • 算法题:给二叉树的层次遍历,求给定node在中序遍历中的下一个node

结果

就当是去练算法题了,挂一次投一次吧

字节跳动-NLP算法工程师-新业务

一面

  • 如何计算输入数据的特征

  • 分类和回归的区别

  • 随机森林和GBDT的区别

  • 遇到的最大困难,怎么解决的

  • 个人优缺点

  • 未来规划

  • 算法题:数组的子集

结果

当时的我碰到数组的子集基本就是没了,一个月之后催HR挂了,但HR说不挂也是能被其他部门捞

百度-机器学习/数据挖掘/自然语言处理工程师

一面

  • 简单讲项目

  • 反向传播怎么回事

  • 什么是梯度消失梯度爆炸

  • HMM了解吗,我说CRF用的多,对比着说了一下

  • 算法题:回文链表,时间O(N),空间O(1)

二面

  • 一面过了接着面

  • 聊项目,两个项目,微调方式,集成方式,数据量,数据预处理,特征

  • 算法题1:s = aactbc ,t = cat,返回t的字母组合在s中出现的开始位置的索引,为1

  • 算法题2:数的字典序,力扣386,变形力扣440

结果

二面第二道题没撕出来,估计泡了一个大池子

海康威视-大数据算法工程师

一面

  • 电话面,感觉要求广度
  • 问了GBDT和随机森林的区别
  • 问了了解不了解表示学习什么的
  • 具体忘记了,大约半个小时

二面

  • 流程很正式,自我介绍+自己满意的一个项目+问我问题+提问面试官
  • 对项目的理解
  • 对数据的理解
  • 知识图谱是什么形式
  • 模型的选择理由
  • 项目过程中遇到的困难:Neo4j,方案制定,结合BERT
  • xgb为什么要用泰勒二阶展开
  • xgb和lr的区别
  • xgb的优点
  • xgb快在哪里
  • 场景题:推理建模,答知识图谱表示学习
  • 介绍部门、业务
  • 如何看待加班
  • 1~2周HR联系

HR面

结果

HR面

小米-NLP算法工程师

一面

  • 自我介绍

  • 项目,说流程,中间也没问啥问题,主要是如何做的,思路

  • 问了技术栈,那些模型用过且熟悉原理,哪些用过但简单了解,哪些没用过但大概知道是啥

  • 了解其他方式做问答吗

  • 算法题:拓扑排序,时间有限,写主要部分

二面

  • 自我介绍,感觉面试官是个level很高的人,笑呵呵的十分从容

  • 沿着项目展开,问模型和特征

  • 中间聊到实体识别的新进展,问答做实体识别的论文等等

  • 回忆起来问了挺多,但记不起来了。。

  • 中途上传了自己的新的简历

  • 算法题:最长公共子序列,没做出来。。于是博文+1

结果

没HR面也给offer的吗

360-数据挖掘工程师

一面

  • 自我介绍

  • 实体识别评测,当时没用BERT

  • CCKS里用BERT了,为啥用BERT做实体识别,为什么接CRF层

  • 实体识别有啥改进的

  • python的yield和return有什么区别

  • linux命令,shell命令,会定时吗,会显示文件所有行去重吗,不会

  • python怎么安装包

  • 看你用了XGB,XGB和GBDT相比有什么优点

  • 算法题:

二面

  • 面试官虽然没有开摄像头,声音有点像王琰师兄,但是全程真的体验很好

  • 自我介绍起手

  • 实体识别的发展历程

  • 说是搜索这边,我说和问答的召回排序有点像,搜索的term weight什么什么的

  • 平时编程用过vim吗

  • 场景题:用户查询日志发现新词

  • 结合项目和凝固度自由度,TFIDF怎么算的说了

  • 数据库都用过哪些

  • 考虑爬虫流程怎么写

  • 反爬比如验证码和封ip怎么办

  • 除此之外,去重和多机怎么做

  • 没实习过,这些工具啥的都不知道,但是面试官很耐心的引导

  • 去重bitmap,哈希

    消息队列数据库啥的

    redis

    回去看看

  • 笔试和一面考察代码,这一面就不写了

  • 部门是360搜索事业部,垂搜地图的数据方向和检索方向

  • 面完了感觉实习经验都有了

三面-HR面

  • 自我介绍
  • 未来规划有没有
  • 开始科普了解做什么产品,产品是业务形态和载体,是以后的工作方向
  • 问是不是保研
  • 问有没有实习,说没有实习确实是劣势项
  • 下面就是提问环节了
  • 问了薪资,说不现在谈
  • 问加班情况
  • 问360搜索和百度搜索要对抗吗
  • 突出垂域的体现
  • 价值观、氛围、学历、平均年龄

结果

十一之后等oc吧

华为-AI工程师

当天是下午两点到四点半面完了三面

一面

  • 自我介绍,说做了什么拿到了奖学金

  • 说问答项目,做这种问答有什么意义

  • 平常用什么编程,对C++,java了解吗

  • 对具体模型算法没有深挖

  • MySQL数据库建几张表,我说我对Neo4j比较了解

  • 编程题:合并两个有序链表,题简单,看编程风格的吧,写完之后评价不错

  • 反问:部门业务

二面

  • 自我介绍,个人博客说了说

  • 介绍项目,和做这个的意义

  • 吐槽商场里的智能机器人

  • 说一面反馈不错,题出的也简单

  • 算法题:判断字符串a是否是字符串b的子串

  • 反问:编程语言

三面

  • 算是第一次HR面?

  • 自我介绍,没问项目

  • 自己的优点

  • 还投了哪些公司,有没有结果

  • 华为面试和其他公司的面试风格有什么不同

  • 答:华为考察项目背后的意义,其他比较深挖知识点?

  • 你喜欢哪种? 答:知识点

  • 然后就开展了知识点的问答

  • 说一下平时做深度学习的流程,中间用到了什么框架

  • 联邦学习和迁移学习啥的

  • 反问:部门业务和计算资源

结果

在等

平安科技-NLP算法工程师

一面

  • 自我介绍

  • 从Embedding开始BiLSTM-CRF的每一块是干嘛的

  • 说一下BERT的整体结构

  • 说一下self attention的具体实现,为什么除以dk\sqrt{d_k}️而不是别的

  • BERT为什么用两个预训练任务,为什么是这两个,为什么不用其他的,为什么不多来几个预训练任务

  • 多任务学习

  • CNN和LSTM的组合做实体识别

  • CNN怎么处理输入

  • 特征怎么加的

  • 看时间还没到聊了下笔试题

  • 然后还没到,问了解Flask吗,我说用过Py的,不了解底层

  • BERT轻量化了解吗,模型蒸馏

二面

  • 说是一面技术,二面常规,三面HR
  • 介绍项目,没技术
  • 现在有没有论文,日本交换人多吗
  • 专业课学过啥,哪个最难,怎么克服的
  • 实验室的研究方向,同学们的研究方向,实验室有多少人,自己老师有多少人
  • 介绍本部门的业务,会有常规紧凑项目,紧凑时加班,相对互联网轻松,每周五天
  • 工作地点接受调剂吗,工作岗位接受调剂吗(算法,大数据开发,数据挖掘)
  • 工作时间能保证吗,未来规划,我说三年以上吧
  • 同等待遇,如何选择平安和华为

结果

等HR面?

电科十所

  • 面试官是两位老师
  • 介绍一下自己
  • 结合自己的简历项目问了一下
  • 你了解我们电科十所吗
  • 为什么想来成都
  • 我们所里都是东北人,连领导都是东北的www

结果

有小米啦,二面就拒啦

好未来-NLP算法工程师

9月5号在出租车上看到短信说好未来技术岗30w起,回寝就投了,经过一个月等来了意向。

一面

  • 自我介绍,问答项目
  • 传统一些的模型熟悉哪些
  • LSTM结构
  • BERT结构
  • GBDT做回归分类时候有什么不同,扯了离散数据要连续或者onehot
  • 模型的理解
  • 在投论文等等
  • 问部门业务
  • 算法题:二叉树中最宽的层,有多少节点

二面

  • 说项目,自己核心的项目,说了问答讲了一遍
  • BERT的结构,mask预训练任务的输入输出
  • 匹配用的BERT怎么做的
  • 序列标注的BERT,和BILSTM+CRF相比有什么厉害的
  • stacking是怎么做的
  • LR和XGB的区别是什么
  • 一个神经网络的DNN的前向反向传播过程
  • 面试官也是沈阳的,口音很熟悉
  • 没面BAT什么的吗
  • 问我在日本是2+2吗,日本什么感觉
  • 算法题:股票的最大收益

HR面

  • 自我介绍
  • 对好未来的认识,了解
  • 讲一个项目,背景介绍,有什么意义,团队分工,主要工作,中间遇到了什么困难,怎么克服
  • 哪里人,他是沈阳大东的,一中哈哈哈
  • 工作地点有什么要求吗
  • 还投了哪些公司
  • 随便聊的话题就有些记不清啦

技术面加面

  • 自我介绍

  • 介绍一个项目,说了主流的做法,有哪些创新点

  • bert之后的改进啥的,接到小米oc之后每天都刷刷抖音,脑子里一片空白,答的不好

  • 场景题:文本纠错,作文自动批改

  • 提问环节:业务内容,工作时间,算法研究还是工程(帮我想想还能问啥)

结果

第一次真正意义的HR面,一天面完的还是挺好的,说等1-2周。收到加面通知。加面之后两小时内就发了意向书,不知道sp没sp,十一之后谈薪。

春招

挖个坑,希望不用春招


最后附上凄惨的总结表,这一片红哇