本次分析基于链家上海官网10月1号数据,总数据条数70220条。
数据获取
数据格式:简介\t小区名\t户型\t大小\t一级区域\t二级区域\t楼层\t朝向\t建造时间\t总价\t每平价格\t看房人数
数据样例:
数据分享地址:
数据试探分析
本次分析使用spark来进行分析,总共item个数为13个。
按照房屋套数,对一级区域进行排序
按照房屋套数,对二级区域进行排序
按照房屋套数,对所有小区进行排序
按照看房人数,对二级区域进行排序
上面区域每平均价为:
按照看房人数,对所有小区进行排序
上面小区每平均价为:
如果有什么分析的想法或者意见,欢迎大家留言。
免责声明:本文章如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系