pandas.read_excel¶
-
pandas.
read_excel
(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, parse_cols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, has_index_names=None, converters=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)[source]¶ 将Excel表读入pandas DataFrame
参数: io:string,path对象(pathlib.Path或py._path.local.LocalPath),
类文件对象,pandas ExcelFile或xlrd工作簿。字符串可以是URL。有效的URL方案包括http,ftp,s3和file。对于文件URL,需要主机。例如,本地文件可以是file://localhost/path/to/workbook.xlsx
sheetname:string,int,strings / ints的混合列表,或None,默认为0
字符串用于工作表名称,整数用于零索引工作表位置。
字符串/整数的列表用于请求多个工作表。
指定无以获取所有工作表。
str | int - >返回DataFrame。list | None - >返回DataFrames的描述,键表示工作表。
可用案例
- 默认为0 - > 1st sheet作为DataFrame
- 1 - >第二张表作为DataFrame
- “Sheet1” - >第一张表作为DataFrame
- [0,1,“Sheet5”] - >第一,第二和第五张表作为DataFrames的字典
- 无 - >所有工作表作为DataFrames的字典
header:int,ints列表,默认为0
要用于已解析DataFrame的列标签的Row(0-indexed)。如果传递整数列表,则这些行位置将被组合到
MultiIndex
中skiprows:list-like
在开头跳过的行(0索引)
skip_footer:int,default 0
行结束跳过(0索引)
index_col:int,ints列表,默认值无
列(0索引)用作DataFrame的行标签。如果没有这样的列,则传递None。如果传递列表,这些列将合并到
MultiIndex
中names:array-like,default无
要使用的列名称列表。如果文件不包含标题行,则应明确传递header = None
converters:dict,默认值None
说明转换某些列中的值的函数。键可以是整数或列标签,值是接受一个输入参数,Excel单元格内容的函数,并返回转换的内容。
true_values:list,默认为None
要考虑的值为True
版本0.19.0中的新功能。
false_values:list,默认为None
要考虑的值为False
版本0.19.0中的新功能。
parse_cols:int或list,默认值无
- 如果为None,则解析所有列,
- 如果int则表示要解析的最后一列
- 如果int列表则表示要解析的列号列表
- 如果string表示列名称和列范围(例如“A:E”或“A,C,E:F”)的逗号分隔列表
squeeze:boolean,default False
如果解析的数据只包含一列,则返回一个Series
na_values:scalar,str,list-like或dict,默认值无
可识别为NA / NaN的其他字符串。如果dict通过,特定的每列NA值。默认情况下,以下值被解释为NaN:'','#N / A','#N / AN / A','#NA','-1. #IND','-1. #QNAN' '-NaN','-nan',
'。#IND','1.#QNAN','N / A','NA','NULL','NaN','nan'。
千:str,默认值无
用于将字符串列解析为数字的千位分隔符。请注意,此参数只对在Excel中作为TEXT存储的列是必需的,无论显示格式如何,都会自动解析任何数字列。
keep_default_na:bool,default True
如果指定了na_values并且keep_default_na为False,则将覆盖默认NaN值,否则将追加它们。
verbose:boolean,default False
指示放置在非数字列中的NA值的数量
engine:string,default None
如果io不是缓冲区或路径,则必须将其设置为标识io。可接受的值为None或xlrd
convert_float:boolean,default True
将整数浮点数转换为int(即,1.0→1)。如果为False,所有数字数据将以浮点形式读入:Excel将所有数字存储为内部浮点数
has_index_names:boolean,默认值无
DEPRECATED:对于版本0.17+,索引名称将基于index_col自动推断。要从0.16.2和之前保存索引名称的Excel输出中读取,请使用True。
返回: 解析的:DataFrame或DataFrames的Dict
DataFrame从传入的Excel文件。请参阅sheetname参数中的注释以获取有关何时返回Dict of Dataframes的更多信息。