pandas.read_excel

pandas.read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, parse_cols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, has_index_names=None, converters=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)[source]

将Excel表读入pandas DataFrame

参数:

io:string,path对象(pathlib.Path或py._path.local.LocalPath),

类文件对象,pandas ExcelFile或xlrd工作簿。字符串可以是URL。有效的URL方案包括http,ftp,s3和file。对于文件URL,需要主机。例如,本地文件可以是file://localhost/path/to/workbook.xlsx

sheetname:string,int,strings / ints的混合列表,或None,默认为0

字符串用于工作表名称,整数用于零索引工作表位置。

字符串/整数的列表用于请求多个工作表。

指定无以获取所有工作表。

str | int - >返回DataFrame。list | None - >返回DataFrames的描述,键表示工作表。

可用案例

  • 默认为0 - > 1st sheet作为DataFrame
  • 1 - >第二张表作为DataFrame
  • “Sheet1” - >第一张表作为DataFrame
  • [0,1,“Sheet5”] - >第一,第二和第五张表作为DataFrames的字典
  • 无 - >所有工作表作为DataFrames的字典

header:int,ints列表,默认为0

要用于已解析DataFrame的列标签的Row(0-indexed)。如果传递整数列表,则这些行位置将被组合到MultiIndex

skiprows:list-like

在开头跳过的行(0索引)

skip_footer:int,default 0

行结束跳过(0索引)

index_col:int,ints列表,默认值无

列(0索引)用作DataFrame的行标签。如果没有这样的列,则传递None。如果传递列表,这些列将合并到MultiIndex

names:array-like,default无

要使用的列名称列表。如果文件不包含标题行,则应明确传递header = None

converters:dict,默认值None

说明转换某些列中的值的函数。键可以是整数或列标签,值是接受一个输入参数,Excel单元格内容的函数,并返回转换的内容。

true_values:list,默认为None

要考虑的值为True

版本0.19.0中的新功能。

false_values:list,默认为None

要考虑的值为False

版本0.19.0中的新功能。

parse_cols:int或list,默认值无

  • 如果为None,则解析所有列,
  • 如果int则表示要解析的最后一列
  • 如果int列表则表示要解析的列号列表
  • 如果string表示列名称和列范围(例如“A:E”或“A,C,E:F”)的逗号分隔列表

squeeze:boolean,default False

如果解析的数据只包含一列,则返回一个Series

na_values:scalar,str,list-like或dict,默认值无

可识别为NA / NaN的其他字符串。如果dict通过,特定的每列NA值。默认情况下,以下值被解释为NaN:'','#N / A','#N / AN / A','#NA','-1. #IND','-1. #QNAN' '-NaN','-nan',

'。#IND','1.#QNAN','N / A','NA','NULL','NaN','nan'。

:str,默认值无

用于将字符串列解析为数字的千位分隔符。请注意,此参数只对在Excel中作为TEXT存储的列是必需的,无论显示格式如何,都会自动解析任何数字列。

keep_default_na:bool,default True

如果指定了na_values并且keep_default_na为False,则将覆盖默认NaN值,否则将追加它们。

verbose:boolean,default False

指示放置在非数字列中的NA值的数量

engine:string,default None

如果io不是缓冲区或路径,则必须将其设置为标识io。可接受的值为None或xlrd

convert_float:boolean,default True

将整数浮点数转换为int(即,1.0→1)。如果为False,所有数字数据将以浮点形式读入:Excel将所有数字存储为内部浮点数

has_index_names:boolean,默认值无

DEPRECATED:对于版本0.17+,索引名称将基于index_col自动推断。要从0.16.2和之前保存索引名称的Excel输出中读取,请使用True。

返回:

解析的:DataFrame或DataFrames的Dict

DataFrame从传入的Excel文件。请参阅sheetname参数中的注释以获取有关何时返回Dict of Dataframes的更多信息。

Scroll To Top