数据分析大作业

   日期:2020-05-19     浏览:147    评论:0    
核心提示:关于大作业的一些思路(无代码)首先我们拿到作业应该理清思路,将任务和数据存储看明白再开始做,我对题目的理解是:先从IPIP或者IPlocation中提取出所选城市的ip网段做成一个筛子,然后将data中的IP按一定的规则提取出来,然后倒入已经做好的筛子中,便可以筛出我们所需要的目标网段路由,而对于后续的做图工作,我们应该提前想好接口1.做筛子第一步是做出我们的筛子,也就是从IPIP中提取出所选城市的IP网段,对于这一步比较简单,可以敲代码解决,当然我觉得有更简单的方法就是直接用Excel打开csv文件数据

关于大作业的一些思路(无代码)

文章结尾有链接,需要自取
首先我们拿到作业应该理清思路,将任务和数据存储看明白再开始做,我对题目的理解是:先从IPIP或者IPlocation中提取出所选城市的ip网段做成一个筛子,然后将data中的IP按一定的规则提取出来,然后倒入已经做好的筛子中,便可以筛出我们所需要的目标网段路由,而对于后续的做图工作,我们应该提前想好接口

1.做筛子

第一步是做出我们的筛子,也就是从IPIP中提取出所选城市的IP网段,对于这一步比较简单,可以敲代码解决,当然我觉得有更简单的方法就是直接用Excel打开csv文件,直接进行筛选工作,然后将筛选的结果CV到新的文件里保存。

2.从data提取所选城市的ip

这一步可以用正则的方式,如果对正则不太熟悉可以采取翻看第五页PPT对数据结构进行仔细分析,然后运用字典和列表的一些基本查找操作取出最里层的跳数:IP:TTL:延迟时间,再进行正则会比较简单一些。
贴一下学习Python比较好用的几个网站
https://www.runoob.com/
https://www.w3school.com.cn/index.html

3.将提取出的ip倒入筛子中

这一步看似比较简单,但是实际上要考虑到后续可视化的问题,所以要提前想好接口。画图所需要的是点集和边集,也就是说我们这一步得到的结果最好就是整理好的点集和边集,而后面第十六页中标黄字段的判断依据,还让我们提取出边界节点,所以这就需要一些列的逻辑规则的建立。
下面我画了一个思维导图来描述这个逻辑

而如何判断IP是否在网段内,我的建议是将点分十进制转成整形,然后就可以直接判断大小来判断IP是否在城市内。
做出点集后不要忘记去重,因为我们最后要画的是拓扑图,对于两个节点之间的多条边是无感的。

4.可视化

可视化我用的是Gephi,因为我选的城市是一个大城市,所以用networkx画出来的图结果感人。

于是我用了Gephi,画出来还可以,虽然因为数据的问题没法体现很好的拓扑关系

顺便贴一下使用Gephi的参考资料
https://blog.csdn.net/qq_42198024/article/details/84965375

5.最后再进行一些节点的权重分析,然后就是实验报告了

最后贴一个验证性的exe用来判断有多少条边和点,记得和ipip以及data放在同一个根目录下哟
https://download.csdn.net/download/liuxingyustar/12427426

 
打赏
 本文转载自:网络 
所有权利归属于原作者,如文章来源标示错误或侵犯了您的权利请联系微信13520258486
更多>最近资讯中心
更多>最新资讯中心
更多>相关资讯中心
0相关评论

推荐图文
推荐资讯中心
点击排行
最新信息
新手指南
采购商服务
供应商服务
交易安全
关注我们
手机网站:
新浪微博:
微信关注:

13520258486

周一至周五 9:00-18:00
(其他时间联系在线客服)

24小时在线客服