热腾腾的亚麻BIE挂筋

十分钟前刚刚面完 阿勒科萨组的BIE,基本上觉得是挂了,要是没挂就准备去烧个香。。。面试的是个冷淡又完全听不出情绪的美国小哥。。
之前看过很多论坛里BIE的原题SQL题,一次都没考到,考到的都是不太确定和不怎么常用的
现在上面筋:

  1. tell me about yourself 老生常谈
  2. 讲一个situation 要做一个decision,然后这个decision怎么影响final outcome
  3. 讲一个current work或者prior work的project,从identity issue开始,然后建立那个process,最终解决问题的一个故事
  4. 讲有没有哪些similar的project 跟以上project相关的(基本就是再讲一些relevant的project来illustrate你的leadership)
    5.问有没有做过data pipeline和ETL相关的 (JD里面写到一句说是ETL的,小哥说自己大部分时间都在做这个,当然组里还有别人在
    做这个)
  5. SQL题

A)
先上来问了一个各种join的区别
然后出题
A table
id
1
1
1
1
1
B table
id
1
1
问 select count() from A inner join B on A.id = B.id,
select count(
) from A left outer join B on A.id = B.id,
select count() from A right outer join B on A.id = B.id,
select count(
) from A full outer join B on A.id = B.id, 这个count分别是多少
都是10,5*2这样

B)
有一个表是 date, device (echo/dot), answers
date, device, answers
2019-01-01 echo 10
2019-01-02 echo 20
2019-01-03 echo 30
.
.
.
2019-01-01 dot 10
2019-01-02 dot 10
问by decive, trailing 7 days的 answer总和是什么, 其实就是想得到一个 date, device, trailing 7 days’answers 这样一个目标表
我用了一个蠢办法做出来了,用了lead()的window function
然后小哥说 那你熟不熟悉sum 我说我熟悉 但是我没用过怎么加到后边的,后来小哥跟我说 可以用sum preceding。。。。。具体可以看这个链接 https://docs.aws.Amazon.com/redshift/latest/dg/r_Examples_of_sum_WF.html
我之前看见过,但是忘记了 爆哭
太惨了 估计是挂了 手心出汗
再接再厉吧…

再补充一个 view和table哪个更快 为什么?那table update了 view会跟着update吗
是view快 我说view是stored query talee还要每次重新run 结果说完我们都陷入了沉默中 table update了view不update 因为view相当于是个snapshot 这样 具体的话我感觉还得好好查查原理

1 Like