Kaggle 的使用
下载
先确认是否有 python3 环境。
apt install python3-pip
pip install kaggle
注册账号
进入 Kaggle 选择 Register,进行注册确认。
有了账号后,进入 https://www.kaggle.com/<username>/account
, 选择 Account,往下找到 API,选择 Create New API Token
。会自动下载一个 kaggle.json 文件。
把这个 kaggle.json 上传到需要下载数据的机器的 ~/.kaggle/ 下,保证 ~/.kaggle/kaggle.json 文件存在。
下载数据
根据 Curated Datasets for the Slingshot Competition,也就是认证的可用数据集进行下载,下载的语句大致是:
kaggle datasets download -d <owner>/<dataset-name> -p /data/
例如下载 COVID-19 Open Research Dataset 的数据到 /data 目录下,就可以:
kaggle datasets download -d allen-institute-for-ai/CORD-19-research-challenge -p /data