Kaggle用の自作PCを作ったけど 昨年末に約38万円(半分がGPU)かけてkaggle兼仮想通貨マイニング用の自作マシンを作ったけれど、いまいち使い勝手が悪くもやもやしていました。 よく考えるとデスクトップPCなので…
カテゴリー: DataScience and AI
データサイエンティストにとって重要なMLOps
データサイエンティストとして働く上で成果を評価されるには、分析結果や開発モデルがビジネスにインパクトある貢献をすることが必要です。そのためには、開発したモデルをしっかりと本番や商用の環境でデプロイし、継続的に活用していか…
実験計画法と分散分析
転職活動の中で、実験計画(Design of Experiments)と分散分析の概念を問われる場面がありました。また、ずっと気になっていて着手していない分野だったため、大村平著の「実験計画と分散分析のはなし」で学習しま…
Kaggle Dataset Upload 自動化
code competitionでのKaggle API を使ったデータのアップロード ここ1,2年、kaggleではcode competitionが増えています。code competitionとはkaggleのno…
便利なリレーショナルデータベースのオープンデータセット:RELATIONAL DATASET REPOSITORY
データベースの形式のオープンデータ データ分析の学習やアルゴリズムの検証をする時に、オープンデータを良く用います。例えば、テーブルデータなら、アイリスのデータセットやタイタニック号の生存者のデータセット、画像データならC…