亚麻ds新鲜店面,刚刚出炉

刚刚面好,非常intense的一个店面,感觉一直在被提问。
讲讲logistic regression 的原理,LR可以做regression吗?如果temperature data,可以用logistic regression 来做吗
logistic regression是linear的吗
有什么例子y和x是nonlinear的?
nonlinear的情况下,用什么方法

decision tree 是nonparametric 吗
random forest 和 decision tree 有什么区别
random forest 为什么work
random forest 里的tree number, tree size 怎么选取
classifciationd不同的model,怎么比较。回答:基于confusion matrix,有accuracy/precision/recall/F1。。
F1什么时候用 回答:class imbalance的时候
假设SVM,logist,RF 的F1 score 分别是0.85, 0.80,0.88. 哪个更好?一定要选一个怎么选?
要Alexa tell a joke,speech recognition 已经转换为文本了,你怎么训练Alexa,怎么model。
BQ:做一个project,本来你觉得你能完成某个部分,结果后来发现你完成不了。你怎么处理?你是怎么发现自己完成不了的。
Coding:给一个文本,格式是###employee id 一行,
日期一行
结果一行
。。。
但是不是每个id 都有三行,有些只有id其他没有。要求列出既有id又有result的。

楼主能问一下 F1 和不同模型的那道题 是越高越好吗?还是根据 null model判断一下。感觉有坑,但又不知道坑 …

我觉得还是要把precision和recall分开看。F1 = 2 (precision*recall)/(precision + recall)。我们找special case:比如SVM的recall是1根据公式它的precision是0.74。 RF的precision是1 它的recall是0.78。 也就是用SVM你能准确预测所有的positive的cases但是同时有16%的false positive。但是RF你没有false positive但是还有12%的positive cases你不能发现。这就要看你具体分析什么了。比如给病人做身体检查的时候,你宁愿有false positive让病人做进一步身体检查也不原因漏掉可能得病的患者?
欢迎大家反馈讨论

楼主面的是哪个组

alexa 的组,具体不知道啊

我觉得还是要把precision和recall分开看。F1 = 2 (precision*recall)/(precision + recall)。我们找speci …

我一开始也是这么说的,意思是不同问题要看不同的指标。但是面试官说,假设就是F1这个指标,怎么判断哪个model好。我内心也是蒙蔽的。我说这三个model在F1数值上comparable,不知道他们之间的difference是不是significant,可能要多次boostrap看看比较,或者要跟test set上的结果结合看,不知道对不对。求指点。