骨骼QA电面

闲言碎语不多讲,上来寒暄了几分钟就开始问问题。用的是hangout视频聊天。

  1. forecast search query in country A in year XXXX

我分成了三段来讲

  • 1) 建模,我没做过forecast所以time series model报了几个,说是要给range,可是我他么没做过,怎么estimate range,总之是open ended,估计也可以建模,看有啥因素影响search query啥的

  • 2) 市场分析,分析一下竞争者和用户需求

  • 3) 成本分析,虽然不差钱

  1. 关于linear regression collinearity和feature selection
  • 大概就是collinearity有何影响以及如果处理
  1. 关于linear regression的beta estimate,如果不是square而是absolute怎么搞
  • 完全不会,想到啥说啥

  • 核心是mean和median的区别

  1. coding, select best N features
  • 用pseudocode的python写了个loop
  1. 我问问题

================================

说是周五前给结果,我自己感觉很不好。面试官非常nice,当我一脸懵逼地瞎说一气时,他及时加入,给我反馈,然后自己一边推导,一边给我解释,然后问我下一步该干啥。

我也不是专业统计出身,很多专业问题都答不上来,没啥思路,听天命吧。

补充:

妹想到啊,居然没有直接拒我,很厚道地给了第二次电面的机会,说是interviewer想要在某些方面再考察一下,果然在毫无压力放飞自我的时候反而有一线曙光,一定是被我不按套路出牌震住了233然而我不想再折腾就不继续了

请问楼主best features是按照什么判断的呢?

这个题是面试官自己写了个解决思路,然后我只是implement。所以感觉google并不是很在乎你是不是会算法,更看重的是统计知识和基本的编程能力。

具体做法是先从features里排列组合选5个,然后for loop对每5个进行fit model,算出mean squared error,然后选出最小的mse

楼主之所以问这些问题,是不是因为简历里面写了很多关于machine learning的东西啊~

我觉得他们都不看简历,就随机问问题。interviewer在面试刚开始就说,“看你并不是统计出身的,我问的这些问题,你要是没学过没听过,就用直觉回答就行,不用慌”。感觉如果是专业出身,反而会问得更细。