DataScience

街の本屋さんのアナログ伝票管理をデジタル化した話

本記事の雑な3行まとめ 背景 プロジェクトのはじまりと課題設定 顧客の事情に寄り添いながらソリューション提案 Google Spreadsheet + GAS で売上管理システムを作る GAS開発環境の整備 GAS の基本 clasp + TypeScript こそ至高 DOA なシステム開発では Type…

尤度と最尤推定がいつも分からなくなる君へ

わたしは、数学がめっちゃ苦手です。どれぐらい苦手かというと、大学入試の二次試験で数学250点満点中60点を叩き出したぐらい苦手です。わたしは物理学科だったので、周囲の友人は数学強強な人ばかりでした。点数開示のときに数学の点数を暴露する勇気があり…

結論、データドリブンな意思決定を下せる友達の多い総合格闘家になりたいのかもしれない

この記事は「[データ分析人材のキャリアアドベントカレンダー](https://qiita.com/advent-calendar/2020/data-learning-guild2020)」の23日目の記事です。内容だけさっと目を通したい方は 結論 をお読みください。

Google Data Portal に入門〜データビジュアライゼーションの基本を少し実践するまで

個人的な学習記録です。Google Data Portal の基本操作とデータビジュアライゼーションにおける色使いの基本を実践してみました。

とある回帰問題の評価指標を考えた話

はじめに 「最近仕事で多次元ベクトル集合を推測する」時の評価指標を考えるシーンがあったので、 備忘録として考えたことを書き記しておく。 実務に関わることなので情報はぼかしている。(故にちょっと抽象的すぎるかも……) 解こうとしている問題 以下のよ…

Pandasを使ってCSV形式のログファイルを解析する時に特定のログメッセージの行だけを抽出する方法

シナリオ 以下のようなCSV形式のバッチ処理のログから、任意のメッセージが記された行をカウントしたい。 log.csv カラム構成 No column type 1 date date 2 time time 3 level string 4 message string あるメッセージが記された行をカウントしたい 方法 結…

【Python】【Pandas】数値データの頻度(割合)をヒストグラムで表示する

■ やりたいこと ■ まずseaborn.displotしよう ■ ヒストグラムと一緒に描画された折れ線グラフは何? ■ 一旦、戻る。何をプロットしたいんだっけ? ■ 補足:pd.DataFrame.value_counts と Interval オブジェクト

Slack分析奮闘記#1 SlackAPIから情報取得して発言内容をWordcloudにする

前回の記事 thinker-masso.hatenablog.com はじめに データ分析の素人である私が、とあるコミュニティのSlackデータ分析にチャレンジさせてもらえることになりました。 せっかくなので、「Slack分析奮闘記」として、そこから得た学びをアウトプットしていこ…

Slack分析奮闘記#0 はじまり

はじめに データ分析の素人である私が、とあるコミュニティのSlackデータ分析にチャレンジさせてもらえることになりました。 せっかくなので、「Slack分析奮闘記」として、そこから得た学びをアウトプットしていこうと思います。 Slack分析プロジェクトのモ…