Twitter技术电面

Twitter电面是视频面试(所以面试前还得换个衣服洗把脸梳个头啥的。。。)
面试官是个中国人上来简单介绍一下自己也没怎么问我的背景就开始做题了
总共面了两道题
第一道:给一堆用户以及其活跃时间的tuple list [<userID1, activeTime1>…<userIDn,activeTimen>], 其中用户可以活跃于多个timestamp,在同一分钟内(e.g. 10:01:01 and 10:01:59)活跃多次的只记为一个active minute;并且activeTime格式整数,记录了从1975.1.1到当时的毫秒数。问题是让统计不同cumulated number of active minutes 对应的用户数量 (e.g. 总共活跃了x分钟的用户有多少个)
解法:用hashmap和set解了一波,写完程序还要运行一下。面试官follow up,问这个东西用mapreduce怎么解决。楼主有五六年没用过map reduce,凭印象讲了一下MapReduce的原理和怎么apply在这个问题上,面试官说差不多答对70%,不过念在我不咋用的份上就不深究了。。。

第二道:给一个图和source以及target找source到target的最短路径
写完程序也要拿test case运行一下出正确结果才行

面完大概过了两周多给了onsite

楼主目前正在焦虑的准备onsite

据说最近业绩好了,所以在扩招

给楼主点个大大的赞

Twitter 家new grad是不是几乎不怎么收啊

今年他家new grad 好像没啥hc. 他家现在无声无息的,直发oa 不见招人

楼主可以相信说说第一题和解法吗?是给定特定时间段的cumulated number of active minutes?还是所有数据的cumulated number of active minutes?多谢楼主,已

是所有数据的cumulated active minutes
我当时就是建了一个hashmap, key=userid,value=set of active minute, 每处理一个tuple的时候先拿activeTime/(60*1000)然后再放进hashmap中对应的set,这样可以有效处理一分钟内多次active的情况。建完hashmap再扫一遍里面的user统计出对应的histogram, histogram我是拿hashmap实现的

明白了 多谢楼主 祝楼主找到心仪的工作~