这在很大程度上取决于它里面有什么。它可以是二进制文件,也可以是文本文件。
如果它是一个文本文件,那么您可以用打开任何文件的相同方式打开它(f=open(filename,"r"))
如果是二进制文件,您只需在open命令中添加一个"b“(open(filename,"rb"))即可。这里有一个例子:
Reading binary file in Python and looping over each byte
根据其中的数据类型,您可能希望尝试通过csv阅读器(csv python模块)或xml解析库(例如lxml)传递这些数据
从上面进一步了解并查看页面后,格式为:
数据格式数据集使用的格式与关系数据库中的文本导出格式类似:
一个标题行包含变量名称,每个实例一行分隔符制表,值之间有缺失值(连续制表)
因此,请看下面的答案:
parsing a tab-separated file in Python
我建议尝试一次处理一行,而不是加载整个文件,但如果您有ram,为什么不……
我怀疑它不能很好地打开,因为文件太大了,但这只是一个猜测。