土地コンペの振り返りメモ(解法以外)

SIGNATEの飯田産業 土地の販売価格の推定(通称:土地コンペ)での取り組みについて、規約に反しない程度で忘れないようにメモしておきます。

 

結果

f:id:HighGradeToppo:20190827201433p:plain

 

方針

ソロ参加限定でフォーラムもないので、

良いスコアを出すためのショートカットが難しい。

→長期間こつこつやる。データについて考える時間を増やす。

→当たり前のことをきちんとやる。

→過去のコンペから学ぶ。

 

当初のがばがばスケジュールは下記の通り

序盤:特徴量を増やす。ドメイン知識を身に着ける。

中盤:いろいろ試す。

終盤:混ぜて無理矢理スコアを伸ばす。

 

プロジェクト管理

NomiさんのHomeCreditコンペの取り組み方を参考にしています。

docs.google.com

 

イデアGitHub Project

 思い付きや参考URLなどを書いておいて、やることに詰まる度に見直していました。

実行結果の管理:Excel

 会社や家でいろんな場所にメモが散乱してしまったので、次はSpreadSheetでやってみます。

 

スコア推移

公開しても問題なさそうなら追記します。

 

atma杯

8/3に【大阪開催】atma杯 オンサイトデータコンペ #1 - connpassに参加しました。

最終的には12位/33人?といまいちな結果でしたが、色々な人と交流できてモチベが向上しました。

また、8/9に振り返りのイベントがあり1位(takuokoさん),2位(hakubishinさん)の公開されていたコードや問題設定について、話すことができたので自分の中になかった発想などを取り入れることができました。次回もあるらしいので楽しみにしています。関西在住はアド

正直参加していなかったら10位にもなれなかったと思ってます。

atma杯運営やコードを公開してくださった方々に感謝してます。

 

その他の取り組み

ケイデンス・オブ・ハイラル ★★★

・Hotline Miami ★★★

・Hotline Miami2 ★★

STEINS;GATE ★★★★★

コンペ最終盤の8/10-13はRTA in Japan Online 2019を見ながら作業していました。

 

コンペ中の主な参考URL

過去のSIGNATEコンペでの取り組みや綴りミスのお話(u++さん)

https://upura.hatenablog.com/archive

直近のKaggleでの回帰コンペ(Elo)の解法まとめ(えじさん)

https://amalog.hateblo.jp/entry/elo-merchant-category-recommendation

テーブルデータのTipsまとめ(ML_bearさん)

https://naotaka1128.hatenadiary.jp/entry/kaggle-compe-tips

序盤ずっと暫定1位だった人のブログ(copypasteさん)

https://copypaste-ds.hatenablog.com/

その他ドメイン知識系のWebページ漁っていました。

 

感想

KaggleだとKernelやDiscuttionベースに進めてしまっていたので、自分で1からデータを見て仮設をたてて特徴量作って試行錯誤してという流れを改めて経験できたのは非常によかったです。コンスタントに結果を出せるように学び続けようというモチベーションにもなりました。