写在回家之前

今天是2019年2月2日,农历腊月二十八,也是我工作日的最后一天。我将搭乘明早8点35的飞机回家。说到回家,心里却没有多少期盼 D:)。

已经好多天没有写博客了,机器学习课程的毕业项目也还没有开始,一直拖着。有点颓D:)。

那到底这段时间都做了什么呢?

  • 工作上完成了一个知识图谱查询展示的项目
  • 迷上了asciidoctor,使用它重写了项目的一些原有文档,新的文档采用它来写(团队需要合理的文档规范!)
  • 学习了下flask

下一步计划:

  • 每天都要去花时间在机器学习项目上(至少两小时,非工作日更多)
  • 一周更新3篇博客(记记流水账也行,有时真的没有什么可写的)
  • 一周阅读两篇paper
  • 搭建自己新的博客,使用flask + asciidoctor
  • 保持运动

发现了一个比较有意思的博客:http://www.columbia.edu/~ahd2125

Advertisements

关于信息组织

如今是个信息爆炸的时代,太多平台提供内容创作,当你读到某个有价值觉得需要反复消化的内容时往往会收藏,但很多时候你不会再去看,一个原因就是内容分散在各平台,当你想起来要去回顾一下的时候发觉要费一番功夫,很容易放弃。当你将这些内容进行整理放在一个属于自己的“地方”(比如博客或笔记)的时候,会有一个二次消化的过程,也比较方便供后续翻阅,因为你知道东西就在那儿。

以下内容来自硅谷王川微博:

“领先指标” (leading indicator) 和 “落后指标” ( lagging indicator ) :

1/ 很多人和公司关心的东西,属于 “落后指标” (lagging indicator) . 

2/ 比如做媒体的,点击率/转发率就属于落后指标, 而文章的深度/长期信息价值属于领先指标。

3/ 做生意时,每一单赚多少钱属于落后指标,而建立起各方面长期的竞争优势, 比如品牌,客户网络,产品创新等等属于领先指标。

4/ 做投资,关心某一笔交易的回报利润,研究预测市场的涨跌属于落后指标。建立起相对于普通人较大的全方位的结构性的信息优势,属于领先指标。

5/ 如果你专注于领先指标的建设,实际上很少有人和你竞争,时间一长,效果就出来了。

更多的内容可在作者公众号找到,以下是一个最新的历史文章目录:

https://mp.weixin.qq.com/s/9H4jFu9xt1h3cL7j7W8uqQ

机器学习博文列表

阅读别人的博文,尤其是优秀的博文,可以让一个人获益很多。对于机器学习,存在一些优秀的博文是需要认真阅读学习的,它们主要来自Kaggle Competition Winners,发布在Kaggle的官方博客上。在这些博文中,作者站在自己的视角上解释了怎么做特征工程和怎么进行模型选择,这是我们在做机器学习时都要解决的问题,这些博文给我们提供了一个很好的可借鉴的经验,并且其相比官方文档而言在模型解释方面可读性更高,更易理解。

闲言少叙,我们看看都有哪些博文:

这个列表以后可能会变得很长。我会不定期地去阅读一下。