p有趣 onsiet面经

来一发P有趣面经

第一轮:地里很多的BlackList
说一下注意的点,会被问letter-based和word-based的trie的trade-off
followup还会问用machine learning的话有没有什么提高效率的办法…orz,用feature match?

第二轮:ReadBlock
地里好像也是有的,哎不过当时也没注意看感觉写的一般

block = 64MB

API byte[] read_block(index)

returns index-th block

1. implement read_range(int startByte, int endByte)

2. implement read_line()

read_line is a class method

init parameters

start byte, byte size

everytime call it, return’'s

第三轮:WordLadder
各种Followup,什么如果是随便找一个网页上面所有词选两个query呢,如果用mapreduce呢

第四轮:MachineLearning轮就不写了…orz

好像大家都说今年bar有下降,不过自己还是有点崩尤其是最后一轮…估计是凉了,祝大家好运~

楼主面的是machine learning岗吗?

同问 楼主是ml 岗嘛?

就是SDE岗,HR安排的0.0

SDE
字数补丁

为什么SDE岗问这么多ML

lz有消息了么

还没有。。估计凉凉

想请问楼主第一轮letter-based和word-based怎么比较呢?只想到了word-based递归调用次数少,更不容易栈溢出?

哈?不需要栈啊。。trie为啥要用栈
他要匹配substring有trie里的完整的一条,用word-based更高效,letter based的话要一个一个字母搞