2026-03-28 08:00:00
设 \(X_1,X_2,\ldots,X_n\) 是相互独立且同为正态分布 \(N(\mu,\sigma^2)\) 的一组随机变量,\(x_1,x_2,\ldots,x_n\) 是抽取自该正态分布的一组样本观察值。
2026-03-27 08:00:00
我以前写过 10 篇用 R 语言绘制地图和空间数据可视化相关的博客。
今天,用一些 Python 模块绘制一幅邵阳市人口的空间分布图。
2026-03-25 08:00:00
MacOS Tahoe 是一次 UI 上大改变的版本更新,流动的玻璃质感,我之前忍不住更新了一下。后来,通过系统设置检查更新,发现新的系统和CLT(命令行开发工具),又更新过系统,也更新过 CLT 。不知怎的,发现 brew 安装的 APP 不能用 brew 卸载,而且 brew 安装 app 的时候,有时候还出现错误。
2026-03-24 08:00:00
本文用 matplotlib 绘制一幅分组折线图,所用数据源:国家统计局统计年鉴 https://www.stats.gov.cn/sj/ndsj/2025/indexch.htm 。想要按私营单位与非私营单位分组展示2010-2024年房价与税前人均年收入的比值的变化趋势,即一般地,一个人需要多少年不吃不喝才能攒够一笔城里买房的钱。
2026-03-19 08:00:00
去年 12 月份中旬,面试淘宝闪购的一个数据科学家职位,考察内容主要分三块 SQL、Python 和 A/B 实验。发现自己对胸有成竹的东西的忽视,以至于在小问题上翻船了。有必要回顾一下 A/B 实验的相关内容,本文介绍 A/B 实验场景中,遇到复杂指标的时候,如何做统计分析。其核心是如何估计一个随机变量的函数的分布,真实的分布是无法获得的,只能根据现有的数据去近似,Delta 方法和 Bootstrap 方法。
2026-03-15 08:00:00
按语:这绝对是一篇迟到的读后感,我今天从未发布的博客里翻出来,起因是 earfanfan 的最近几次鞭策。我翻出来这个草稿,发现之前还胡乱写了不少,再花些功夫应该快速能结项。此外,一个重要原因是刚度过一次精神危机,我有心力再度拿起笔来写这几乎遗忘的读后感。《白鹿原》的书我看了两遍,第一遍看的是新版,是1998年获第四届茅盾文学奖时的本子,后了解到还有之前的一个版本,即 1993 年出版的一个版本。据说,当时为了通过评委的审核要求,做了一些删减,我抱着好奇的心态,在潘家园地摊上淘了一本,也看了一遍。两个版本的书,从书的装帧质量上来看,老版本纸张更好,耐翻,封面设计更有韵味,是一个满脸沧桑的老人形象,这和作者陈忠实倒是有几分相似。今年,在西西弗书店,偶然发现还有一个该书店特供的一个版本,摆出来的试读本上手感觉质量不错。