Kaggle 的使用

2020/11/24 Linux

Kaggle 的使用

下载

先确认是否有 python3 环境。

apt install python3-pip

pip install kaggle

注册账号

进入 Kaggle 选择 Register,进行注册确认。

有了账号后,进入 https://www.kaggle.com/<username>/account, 选择 Account,往下找到 API,选择 Create New API Token。会自动下载一个 kaggle.json 文件。

把这个 kaggle.json 上传到需要下载数据的机器的 ~/.kaggle/ 下,保证 ~/.kaggle/kaggle.json 文件存在。

下载数据

根据 Curated Datasets for the Slingshot Competition,也就是认证的可用数据集进行下载,下载的语句大致是:

kaggle datasets download -d <owner>/<dataset-name> -p /data/

例如下载 COVID-19 Open Research Dataset 的数据到 /data 目录下,就可以:

kaggle datasets download -d allen-institute-for-ai/CORD-19-research-challenge -p /data

Search

    Table of Contents