Skip to content
View gan0606's full-sized avatar
  • Japan
  • 04:31 (UTC +09:00)
Block or Report

Block or report gan0606

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
gan0606/README.md

Portfolio

最終更新日: 2024/5/24

スキル

①言語

  • Python
    データ分析、機械学習、深層学習、ファイルやフォルダの操作、簡単なアプリ開発
    【使用経験のあるフレームワークやライブラリ】
    os, glob, shutil, re, Pandas, Numpy, scipy, matplotlib, seaborn, plotly, scikit-learn, LightGBM, Catboost, Pytorch, Prophet, YOLOv8, OpenCV, Transformers, Peft, Streamlit, SHAP, LangChain

  • SQL
    Googleデータアナリティクスプロフェッショナル認定で基礎を学習
    BigqueryからSQLを用いてデータの抽出し、GoogleColab上でPythonを用いて分析した経験有

  • R
    Googleデータアナリティクスプロフェッショナル認定で基礎を学習
    【使用経験のあるパッケージ】
    tidyverse, gglot2

②開発ツール

  • Git, GitHub
    アプリ開発はGitの環境下で行い、ブランチを切って、アプリに機能を追加しています。

  • Linux
    基本コマンド
    アクセス権限の変更
    ファイルのバッシュ化
    シェルスクリプト(学習中)

  • AWS(学習中)

資格

  • SolidWorks認定試験(CSWA)(2019年11月取得)
  • 日本情報処理検定 表計算2級(2022年2月取得)
  • 日商簿記2級(2022年5月取得)
  • GoogleDataAnalyticsProfessional認定(2024年4月取得)
認定バッジ
  • GoogleCyberSecurityProfessional認定(2024年5月取得)
認定バッジ

取り組んだ課題

構造化データの分析

機械学習を用いた分類

ROC AUCスコアが0.81で、再現率と適合率が比較的高いCatboostモデルを構築しました。また、特徴量の重要度をSHAP分析を用いて可視化しました。 そして、分析結果をStreamlitを用いてアプリ化しました。

機械学習を用いたタイタニック号乗客の生存確率分析

Kaggle分析ノートブック

データの出典元

機械学習を用いた回帰

RSMEスコアが0.055で比較的精度が高いLightgbmモデルを構築しました。また、特徴量の重要度をSHAP分析を用いて可視化しました。そして、分析結果をStreamlitを用いてアプリ化しました。

機械学習による米国住宅価格の予測

Kaggle分析ノートブック

データの出典元

非構造化データの分析(画像分類)

深層学習を用いた画像分類

PyTorchを使用してオリジナルの畳み込みニューラルネットワークを構築し、画像分類を行いました。モデルの精度は77.5%で、結果をStreamlitで可視化しました。

オリジナルニューラルネットワークによる猫と犬の画像分類

Kaggle分析ノートブック

データの出典元

転移学習を用いた画像分類

PyTorchのDenseNetを用いた転移学習による画像分類を行い、精度は89.8%でした。結果はStreamlitで可視化しました。

転移学習による花の画像の分類

Kaggle分析ノートブック

データの出典元

非構造化データの分析(物体検出)

ヘルメット着用促進システム

・YOLOv8を用いて画像と映像から物体検出を行うアプリを開発しました。
・検出対象は3つで、2つの検出でmAP=約0.9という高い精度を実現しました。
・結果をStreamlitでアプリ化し、ブラウザ上で簡単に操作できます。

ヘルメット着用促進システム

下記のリンクから動画検出も含めたアプリにアクセスできますが、環境によっては動画が再生されない可能性があります。
因みに、Windowsのブラウザでは動画を再生できませんでした。一方で、iphone環境では動画を再生することができました。
アプリで動画を確認できない方は分析結果報告スライドのfig07をご確認ください。

ヘルメット着用促進システム(映像検出結果付)

分析結果報告スライド

データの出典元①

データの出典元②

XML形式からYOLOv8形式への変換アルゴリズムの習得

  • この分析はxmlファイルで提供されたannotation情報をYOLOv8モデルに入力できる形式に変更することを目的に行いました。
  • ファイルの形式を変更してYOLOv8モデルに入力してモデルを学習させることができました。
  • 精度はあまりよくなく、mAP=0.49という結果でした。
  • mAPが学習の途中から上昇しなくなったので過学習を起こしている可能性があると考察しました。
  • 過学習を起こさないためのモデルの詳細な設定などはまだ習得できていないのでこれから勉強していきたいです。

Kaggle分析ノートブック

データの出典元

COCO形式からYOLOv8形式への変換アルゴリズムの習得

  • annotation情報をCOCO形式からyolo形式に変更してYOLOv8に学習させる課題

GitHubリポジトリ

データの出典元

CSV形式からYOLOv8形式への変換アルゴリズムの習得

  • annotation情報をcsv形式からyolo形式に変更してYOLOv8で学習させる課題

GitHubリポジトリ

データの出典元

非構造化データの分析(自然言語処理)

Transformersを用いたテキスト分類

BERTをPeftでファインチューニングを行い、自然言語分類モデルを構築しました。モデルはF1スコア0.91を達成し、再現率と適合率のバランスが良い結果となりました。

Kaggle分析ノートブック

データの出典元

LangChainを用いたAI心理カウンセラーの開発

LangChainとStreamlitを用いて、ChatBot形式のAI心理カウンセラーを開発ました。
このアプリケーションは、2つの目的で開発しました。
1つ目は、プロンプトエンジニアリングを学習することです。
2つ目は、就労移行支援事業所の支援員の方たちのAIアシスタントを作ることです。
支援員の方たちは「面白くて、実用的です。」と言ってくださいました。

AI心理カウンセラー

GoogleProfessional認定ケーススタディー

GoogleDataAnalyticsProfessional認定最終課題

分析結果報告スライド

分析ノートブック

データの出典元

Popular repositories

  1. deproy_test deproy_test Public

    分析結果の共有3

    Jupyter Notebook

  2. image_recognition_v2 image_recognition_v2 Public

    オリジナルのモデルを使って画像認識を行います

    Python

  3. flower_classification flower_classification Public

    Python

  4. titanic_result titanic_result Public

    Python

  5. portfolio_titanic portfolio_titanic Public

    Python

  6. portfolio_house_price portfolio_house_price Public

    Python