人地关系第一期挖掘结果校验报告与工作规划

1. 摘要

人地关系的家和公司挖掘,经过三轮迭代,融合了AMap和开放平台用户数据,挖掘出来3.32亿名用户的常驻地,家和公司(截至2015-05-01)。其中针对amap日活用户而言,家的总体覆盖率达到77.32%,公司的总体覆盖率达到80.17%。

我们采用了两份不同样本集来对挖掘结[......]

Read more

数据挖掘工作流

目前带着一个小组在做全面的用户画像的工作,不少同学都是第一次接触数据挖掘的工作。于是总结了一个较为简单,通用的数据挖掘工作流,也贴出作为自己的工作结果吧。

数据挖掘工作流
=========
#### 1 收集数据
收集数据一般是补充外部数据,包括采用爬虫和接口,获取,补充目前数据不足部[......]

Read more