R 语言:缺失数据的多重插补 多重插补 (Mutiple Imputation, MI) 是一种应对无反应误差 (nonresponse bias) 的方法,即当人们无法对调查做出回应时,会丢失研究数据。将创建同一数据集的多个版本,然后将其组合以形成“最佳”值。 2020-07-29 IT R 科研 数据分析 R 数据分析
Python 中 map、filter、reduce 和 zip 函数的用法 Python 自带模块的数据结构屈指可数,list是一个随时都在用的数据结构,对list进行操作python内置了几个函数对python的list进行操作时候非常方便。 2020-07-17 IT Python Python
Pandas CSV 及 Excel 操作备忘录 最近笔者用爬虫爬取了 48 万例病人数据,整个文件大小有 600m。用 MS Excel 处理的话,打开就得花 10min,每进行一个操作,少则 10s,多则 5min,有甚至直接卡死。无奈之下,只能用 Python 解决了,第一时间就想到了大名鼎鼎的 Pandas。 2020-07-16 IT Python 科研 数据分析 Python Pandas
Ubuntu Server 安装 JupyterLab JupyterLab 是 Jupyter 项目的下一代基于Web的用户界面,根据官方文档,JupyterLab 最终将取代经典的 Jupyter Notebook 2020-06-28 IT Python Linux Python Jupyter