www.rtmj.net > python pAnDAs导入时报错

python pAnDAs导入时报错

pandas 安装有问题

你遇到的问题一看就是少装了包.在windows下安装pandas,只安装pandas一个包显然是不够的,它并没有把用到的相关包都打进去,这点是很麻烦的,只有等错误信息出来后才知道少了哪些包.我总结了一下,一共需要安装如下包:

在最后加上engine='python'就可以了,即 users = pd.read_table('users.dat', sep='::',header = None, names = unames , engine = 'python')

有可能是Python版本过旧,你在控制台重新pip

1. 启动IPython notebook,加载pylab环境:2. ipython notebook --pylab=inline3. Pandas提供了IO工具可以将大文件分块读取,测试了一下性能,完整加载9800万条数据也只需要263秒左右,还是相当不错了.

安装 pandas:pip install pandas导入 pandas:import pandas as pd

数据导入外部数据导入数据指定导入的文件设定条件ok

dtype={'列名': object}

只能用索引切片的方式如根据索引对data进行删除重复行,并保留第一个数据:data_unique = data[~data.index.duplicated()]

安装pandas失败,不知道原因:自己解决了.原先安装的是 numpy 1.6.1 ,把它删除,下载个最新的1.9版本安装,再安装pandas就行了!不知道为什么会这样,反正现在好了!

网站地图

All rights reserved Powered by www.rtmj.net

copyright ©right 2010-2021。
www.rtmj.net内容来自网络,如有侵犯请联系客服。zhit325@qq.com