Remote Data Access¶
DataReader¶
删除子包pandas.io.data
以支持可单独安装的pandas-datareader包。这将允许数据模块独立更新到您的pandas安装。pandas-datareader v0.1.1
的API与pandas v0 .16.1
。(GH8961)
您应该替换以下的导入:
from pandas.io import data, wb使用:
from pandas_datareader import data, wb
Google Analytics¶
ga
模块为Google Analytics API提供了一个包装,以简化检索流量数据。结果集将解析为具有从源表派生的形状和数据类型的pandas DataFrame。
Configuring Access to Google Analytics¶
您需要做的第一件事是设置对Google Analytics(分析)API的访问。请按照以下步骤操作:
- 在Google Developers Console中
- 启用Google Analytics(分析)API
- 创建一个新项目
- 为“已安装的应用程序”创建一个新的客户端ID(在新创建的项目的“APIs&auth / Credentials部分”中)
- 下载它(JSON文件)
- 在您的机器上
- 将其重命名为
client_secrets.json
- 将其移动到
pandas/io
模块目录
- 将其重命名为
第一次使用read_ga()
函数时,将打开一个浏览器窗口,要求您对Google API进行身份验证。请继续。
Using the Google Analytics API¶
以下内容将从特定媒体资源获取2014年第一季度每周的每日用户和浏览量(指标)数据。
import pandas.io.ga as ga
ga.read_ga(
account_id = "2360420",
profile_id = "19462946",
property_id = "UA-2360420-5",
metrics = ['users', 'pageviews'],
dimensions = ['dayOfWeek'],
start_date = "2014-01-01",
end_date = "2014-08-01",
index_col = 0,
filters = "pagePath=~aboutus;ga:country==France",
)
唯一的强制参数是metrics,
dimensions
和start_date
。我们强烈建议您始终指定account_id
,profile_id
和property_id
,以避免在Google Analytics(分析)中访问错误的数据桶。
index_col
参数指示必须将哪个维度用作索引。
filters
参数指示要应用于查询的过滤。在上面的示例中,网页网址必须包含aboutus
,访问者国家必须是法国。
详细信息如下: