俵言

しがない社会人が書く、勉強とかのこと。最近は機械学習や kaggle 関連がメイン。

小ネタ:LightGBM の callback が何を受け取るのか確認する

LightGBM で callback 関数が使いたくなったので、何を受け取るのか調べた話です。

LightGBM で強引に Multi-Task(は???) Regression を行う

めちゃくちゃ強引な方法を用いて LightGBM で見た目だけ Multi-Task(?) Regression らしきことをしたお話です。

小ネタ:LightGBM の objective を metric から消し去る

LightGBM でカスタムメトリック"だけ"使いたいときにやる小ネタです。

小ネタ:pathlib.Path と Kaggle Notebooks のディレクトリ構成

pathlib を最近使っている & 初歩的な使い方でも便利という話。

小ネタ:numpy.repeat での繰り返しパターン生成と advanced indexing

個人的によくやる numpy.repeat の使い方と、それを応用した advanced indexing の小ネタです。

小ネタ:Albumentations の border_mode 早見表

albumentations で使う border_mode (OpenCV 準拠) の早見表です。

Kaggle と出会ってから Master になるまで、そしてこれから。

Kaggle に出会ってから Mater になるまでの話と、これからの話。

効果検証入門 1章の個人的最難関だった t 検定の話

効果検証入門の1章で躓いた有意差検定のパートについて、 t 検定を復習して行間を埋めた話です。

熱海で spaggle 合宿したら最高だった件

ひょんなきっかけで行くことになった。熱海 spaggle 合宿の旅行記です。とても楽しかった。

感想文:データサイエンスのための数学 を読んでいます (その1)

データサイエンスのための数学を読み進めるためのチェックポイント(その1)です。第Ⅰ部 線形代数 の前半について感想など。

小ネタ:python で json を yaml として読みたいとき無いですか?

小ネタです。json を yaml として読めると嬉しいときがあるよねというお話。

DSB2019 のラスト5サブを全て Error で溶かした kaggler がいるらしい

Data Sience Bowl 2019 での失敗談についてデータの軽い説明をしつつ書きました。

SPAでKaggleするために回った施設を独断と偏見で紹介する

こちらの記事は kaggle その2 Advent Calendar 2019 の2日目の記事となります。 これまで SPA Kaggle のために回ってきた温泉施設の紹介など。

分析コンペLT会 #1 に参加しました

こちらは分析コンペLT会 #1 に参加してきた感想文です。実験を効率的に回すための話が多目でとても勉強になったほか、オンプレマシン構築のすすめなど内容がバラエティに富んでいてとても楽しかったです!

Connehito Marché vol.6 〜機械学習・データ分析市〜 に参加しました。

Connehito Marché vol.6 〜機械学習・データ分析市〜 というイベントに参加してきたので、発表資料と感想をまとめました。

【画像処理 & 機械学習】論文LT会! #5 @ LPIXEl に参加しました。

LPIXElさんで 2019/7/22 に行われた論文LT会で参加 & LT発表をしてきました。今回は kaggler の侵略により 4人の Master が発表を行っており、中々肩身が狭かったです笑

メモ : TLで気になった本を羅列する (~2019/8/3)

Twitter などで見かけた本とか雑誌で気になったものはとりあえずブクマするのですが、いつの間にか結構たまってえらいことになってたので整理のためにメモ。

小ネタ : SlideShare でハイパーリンクがクリックできない問題を調べた

SlideShare に上げたスライド上でのハイパーリンクの話です。 古くから知られている問題(というか仕様)のようなのですが、知って結構驚いたので書きました。

感想文:今更ながら Kaggle Tokyo Meetup #6 を振り返る

お前3連休の残り何しとってん?って話ですが、今更ながら Kaggle Tokyo Meetup #6参加した一口感想を資料を振り返りながら書こうと思います。あと LT させてもらった感想とか。暇つぶしにどうぞ。

【画像処理 & 機械学習】論文LT会! #4 @ LPIXEl に参加しました。

LPIXElさんで 2019/7/4 に行われた論文LT会に参加してついでに論文紹介LTしてきました。実は #2 から連続で参加してるのでこれが3回目の参加になります。 lpixel.connpass.com こちらのイベントは基本的に論文を読んでLT発表することが主目的なので(聴講枠の…

振り返って:ポエム、あるいは自己紹介的な何か

※この記事に技術的要素はありません。Twitter で垂れ流そうとしたら長くなりそうだったためにブログに書いたネガティブポエムなので暇つぶし程度にご覧下さい。 はじめに 最近、でもないか、転職の話が Twitter では毎日のように流れてきます。 直近の僕の観…

NeurIPS2018読み会@PFN 聴講メモ(テーマ発表)

先日 1/26に NeurIPS2018読み会@PFN に聴講参加してきました. この投稿はそのメモ(+振り返りでの補完)にります. connpass.com 実はブログに公開するつもりはなかったのですが, 用事で参加できなくなった会社の先輩に「後でメモを共有して欲しい」と言われて…

kaggle で初めてメダル(silver) を取ったものの、お詫びせざるを得ない件

チーム(AgroDesign) で参加していた Human Protein Atlas Image Classification で22位になり、silver medal を獲得しました! 前参加した台風コンペ(@SIGNATE)では被災して 最下位に落ちたため、この結果は本当に嬉しかったです。正直言うと gold 取りたか…

初めての画像分類コンペでめっちゃ頑張って上位まで行ったが、閾値を攻め過ぎて大爆死した

9/11 - 10/26 (おおよそ1ヶ月半) にかけて、以下の 「熱帯低気圧(台風等)検出アルゴリズム作成」コンペ に参加しました。 signate.jp 得るものは本当に沢山(DNNの実装や学習の経験・ノウハウなど)あったのですが、結果として最終提出の順位は 5位(public) …

ゼロから作るDeep Learning - 第5回:4章(その1)損失関数

この「ゼロから作るDeep Learning」の勉強内容をひたすら書いていく記事も、遂に本題である学習の話に入っていきます。

gensim の tfidf で正規化(normalize)に苦しんだ話

python の gensim で試しに tfidf をやってみたが、正規化の仕様がよくわからなかったから調べたって話

ゼロから作るDeep Learning - 第4回:3章(その3)ニューラルネットワークを試してみる

今回も引き続き3章です。今回は その3:試してみる編 です。この前作ったニューラルネットワークを試すだけなのでさらっと終わると思います。

ゼロから作るDeep Learning - 第3回:3章(その2) pythonによるニューラルネットワークの実装

前回に引き続き3章を勉強していきます。今回は その2である実装です。 今回はまず行列演算の話をしてから、NNの実装、加えて最終的な出力をどうするかの話をつらつらと書いていきます。

ゼロから作るDeep Learning - 第2回:3章(その1)パーセプトロンとニューラルネットワークの違い

個人的には「パーセプトロンの方が単純らしい」ぐらいの印象を持ってたんですが、よくよく考えると両者がどう違うのかは知りませんでした。3章ではその話が出てきます。

ゼロから作るDeep Learning - 第1回:パーセプトロン

僕の好きなpythonで初歩の初歩から深層学習を学べるので、絶対いい勉強になるってことで読むことにしました。