整套大数据学习资料(视频+笔记)百度网盘无门槛下载:http://www.edu360.cn/news/content?id=3377

16.7.1社区判断

hadoop 花牛 10℃ 0评论

在Infochimps数据集中,最有趣的网络是大规模爬取Twitter社区数据,分析得到的网络图。它有多达9千万个节点和20亿条边,这个图对于帮助我们理解人们的谈话和掌握他们之间的关系来说是一个非常了不起的工具。下面使用“谈论InfochimpsHadoop的用户"构成的子图,我们利用三 种方法来构建用户社区图:

    • 和他们一起讨论的用户(@reply)是谁?

    • 他们是否与参与问题讨论的人互换了意见(对称链接)

    • 在用户社区里,用户彼此关注度有多少(聚类因子)

转载请注明:全栈大数据 » 16.7.1社区判断

喜欢 (0)or分享 (0)
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址