《精益数据分析》书摘

豆瓣链接
互联网流量增长日趋饱和,各大互联网公司对于流量的获取也逐渐的从跑马圈地转向精耕细作。大数据逐步从概念转向实际应用,如何将手中的数据“璞玉”雕琢成增长的玉如意也成为各个公司数据部门的头号目标。两者结合,在有限的流量下,用数据驱动,把每份流量的价值发挥到最大就成了新时代下增长的必经之路。

《数据驱动增长》一书由阿利斯泰尔·克罗尔写于2014年,如今已经过去四年多,其中的经验、框架依然不过时。针对美国互联网公司的一系列建议,放在中国,相当一部分也依然实用。下面摘录原书的一些观点,并附上自己的理解。

Read more

《暗时间》书摘

豆瓣链接

  • 贝叶斯

    • 先验概率(模型的本身可能的概率, 奥卡姆剃刀)
    • 后验概率(模型生成样本的概率,最大化后验概率就是极大似然估计)
    • 模型泛化(过拟合、欠拟合也就是在先验概率、后验概率平衡)
    • 没有先验概率的时候,假设虽有模型概率一致,这就用到最大似然估计
    • 贝叶斯+奥卡姆剃刀(不考虑先验概率) 听起来还是个极大似然估计(后验概率)的问题
    • 信息论+贝叶斯: 一个模型的好坏取决于模型的编码长度lg(先验概率)+这个模型下数据的编码长度lg(后验概率)
    • 强化学习是一种复杂模型(模型编码长度长)? 还是一个简单模型,用多个步骤来求解呢?
Read more

《财富自由之路》书摘

豆瓣链接

并不像书名写的那么直接,没有太多关于财富自由的具体计划,确有更多元认知上的提升,财富自由只是提高认知路上的一个不经意间到达的里程碑

Read more

《把时间当做朋友》书摘

豆瓣链接

近期,在朋友的推荐下,读了《把时间当作朋友》这本书。确是一本很好的时间管理,不,应该是自身管理类别的书。这一类的书我读过并不多,相比于《少有人走的路》,这本书更有实践指导意义一些。作者写书逻辑很严密,比较对我这种理工男的胃口。
书中提到,长时间的积累会让你在多年后发现有一个质的改变。读书,自然也是一种积累。最简单的方式就是摘录其中的句子了,先采用这种最朴素的方式开始吧。
下面是我摘录书中的句子,有的是原句,有的是按照自己的理解复述的句子。

Read more

《激荡三十年·上》书摘

豆瓣链接

《激荡三十年》分上下两本,本文摘抄下册的一些让人有感而发的句子以及自己的一些启发、随感。

1993年5月10日,北京市政府正式宣布,从这一天起,取消粮票。

粮票作为一个年代感十足的东西,常常被老一辈提起。 没想到我出生的头三年里尽然和它也有交集。规则是死的,市场是活的,每个政策都有一个对应的市场价。

1994年前后,中国商业的火山口就在保健品和饮料食品领域。

Read more

《激荡三十年·上》书摘

豆瓣链接
《激荡三十年》上下两本是今年3月份就读完的书了。一直放着没有写书摘,一方面自己懒着了,总觉得写博客是一件非常”隆重”的事儿,不愿意开始。另一方面,全书侃侃而谈700多页,依然只是对这历史上浓墨重彩的三十年的一个轮廓的草草勾勒,担心自己只是流水账般的复述这些历史事实而缺少自己的思考。其实,把内容摘下来并附上一些自己简短的感想何尝不是一种思考呢? 这些更加接近于”原始数据”的书摘正是进一步思考,或者和志同道合的朋友们交流的基础。

一个人要让自己快乐其实是一件不难的事,你只要给自己一个较长时间的目标,然后按部就班地接近它,实现它。结果如何,在某种意义上可能是不重要的,重要的是,在这个过程中,你会非常的单纯和满足。

Read more

《彼得林奇的成功投资》书摘

豆瓣链接

进入2017,决定开启我的投资之旅。之前也读过一些关于经济、金融方面的书:《经济学通识》、《金融的解释》、《富爸爸、穷爸爸》。真正的投资一直没有开始,总觉得自己还没有准备好。新的一年开始,决定做一把行动派,把一些手头的闲钱投入股市。作为多年读书的“书呆子”,自然还是要买一本经典放在枕边稳稳军心的。豆瓣一搜,《彼得·林奇的成功投资》排名股票类的第一名,遂读之。

Read more

《从0到1》书摘

豆瓣链接
个人对商业类别的书目并不太感兴趣, 这方面的知识一直时自己的薄弱环节。由于多位朋友推荐,近日来翻看了Peter·Thiel的《从0到1》。这本书还有个霸气十足的副标题——开启商业与未来的秘密。
总体感觉:有一些新的认知上的启发,但对于实践上的指导意义却不太那么明显。有点类似于之前读的《富爸爸,穷爸爸》,《黑客与画家》这类书籍的感觉。美式风格十足,或许生活在美国,生活在哪个年代会更加感同身受一些吧。

Read more

《国史大纲·下》书摘

豆瓣链接

国史大纲这本书2012年就买了,2016年才读完。还是囫囵吞枣的读完了一遍,实在惭愧惭愧。
自己从小喜欢历史,但那时候无非是对一些王侯将相的故事感兴趣。喜欢一些战争、权谋、兴替的情节。至于政治体制、文化风情、民族兴衰,对于年幼的我还太深奥,也不那么有趣。小时候读的是《中国通史》一套书,总共六本,从先秦到明清,类似连环画的形式,很过瘾。而《国史大纲》这本书,显然又是更高一层面的通史书了。
开始读的时候,有些吃力,竖版排版的繁体字,对于一个长久生活在大陆的人,还是有点陌生。书中有很多字体很小的考据,有些过于翔实,读起来容易让人忘记了主题。后来我就挑选字体较大的正文阅读,小字体的捡感兴趣的扫一扫,这才赶上了进度,吞完了这本书。
好书一定是要读第二遍的,或许一年后,或许十年后。总之,等自己阅历增长了,一定能读出另一番味道的。
这本书到了下册的南北文化之转移一章,我才开始了系统的读书笔记,记录一些自己觉得精辟的评论,一些总结。就暂且从这里开始记书摘吧。

Read more

Kylin, Mondrian, Saiku系统的整合

本文主要介绍有赞数据团队为了满足在不同维度查看、分析重点指标的需求而搭建的OLAP分析工具。这个工具对Kylin、Mondrian以及Saiku做了一个整合,主要工作包括一些定制化的修改以及环境的配置。
目前这个系统还处于一个需要优化、完善的过程,这篇博文也会相应地更新。

背景

有赞发展的初期,数据团队主要的工作之一就是根据运营人员的报表需求,编写sql,从hive中获得数据并写入mysql中存储。最后,前端人员写相应的代码展现mysql中存储的报表数据。
随着公司业务的快速发展,如此长周期的报表开发流程已经很难跟上运营人员的分析需求了。为了避免深陷报表开发、维护的泥潭,数据组决定调研大数据场景下的OLAP分析工具。参考了明略数据的解决方案之后,我们选择整合KylinMondrianSaiku来实现这样一个OLAP系统。

Read more