python

pandasで時系列カラムの欠損行を埋める

ログデータから計測時間を元にgroupbyして集約データにするときに、 広告のクリックのように滅多に計測できないものの場合は その時間帯の行が無いことがある。 具体的にはこんな内容のデータ。 click created_at 1 1 2017-07-01 01:00:00 2 1 2017-07-01 02…

RユーザがPythonを1ヶ月触ってみて

最近はRよりもPythonを触るようになったのでメモ。 RはHadleyさんの作ったライブラリ達*1を使えばなんでもできると思っている。 新しい言語を学ぶのは視点が広がるので良いです。 Rと比較して Pythonは読みやすい。 インデントが良いのかな。ちゃんと書かな…

thinkstats2 1章

英語は無償で読めるのだけど、そこに時間を使うのもアレなので本を購入。 ただ、githubにある演習問題は英語だったので、結局読むことに。まぁ本文読むよりは良いけれど。 演習の2つ目の穴埋めで早速ハマる。coodbook のページは度数分布表になっているので…