(ご参考:記事中の下線部にはURLが仕込まれていますので適宜クリックしてみて下さい!!)

■ 今日のおしながき

はじめに
回帰の事例:一関工業専門学校 suzukiLab
分類の事例:鳥羽商船高等専門学校 ezaki-lab
E資格の観点で復習(回帰、分類)
次回以降の予定

■ はじめに

今年もDCONの季節です!

DCON2024のエントリーが2023/7/3に開始され、いよいよその季節という感じになって参りましたが、皆様いかがお過ごしでしょうか?また、来たる2023/7/17(月)午前11時より、DCON2023大会の模様が、なんと今年は特番としてNHK総合で放送されるそうです!!これも楽しみです。

で、本題。


DCONの公式Youtubeチャンネルで公開されているアーカイブビデオ、E資格の勉強にもとても役立ちそうなのです。出場した学生さんは一生懸命技術解説してくれますし、実際の用途と技術のつながりもよくわかりますし、加えて我らが松尾先生が全出場チームの技術をコメントで補足説明してくれます。そんなわけで、とても理解が深まるコンテンツなのです。

というわけで、これをE資格の勉強に生かさない手はない、と思って、今回ビデオのハイライトへのリンクと共にまとめてみました。3回程度に分けて公開していきます。初回は、教師あり学習の典型的なタスクである「回帰と分類」がテーマです。

■ 回帰の事例

回帰(regression)とは、入力データを元に、目的とする数値を推測する行為です。AIの勉強をはじめた時によく引き合いに出される、「駅からの距離から家賃を推測する」という行為などが該当します。

DCON2023では、一関高専 suzukilabさんが回帰を用いていたと思われます。中身を見ていきましょう。

2 一関工業専門学校 suzukiLab

・テーマ名・概要  (当日のプレゼンへのリンクはこちら
働く現場のWB monitor
WBはWell Beingの略
働く環境のやる気・満足度・達成感の様子をWB度として見える化し、休退職を考え始めたきっかけを知る
WB度の計測にはヘモグロビンの濃度を用いているそうです。それは、やる気や達成感を感じるとドーパミンが放出され、その結果ヘモグロビンの濃度が増加するから、だそうです。
image.png 142.78 KB
WB度の推測に用いる入力は脈波です。システムの解説はこちらをご覧下さい。https://www.youtube.com/watch?v=xc_mTBptzNo&t=3494s
image.png 125.21 KB
・松尾先生からの技術コメント(こちらのリンクで視聴できます)

- 光で血管の容積を見てヘモグロビンの濃度を推定している。それがストレス等々との相関がある。
- 頭全体に16個のプローブをつけて計測したデータを教師データに用いて、利用時には首筋だけで測定できるようにした。

 ・もりさん補足と想像
このシステムでは、脈波からヘモグロビンの濃度を推定する回帰を行っているものと思われます。

回帰問題を解くシステムは一般に、入力がn次元であれば入口がn個、出力がm次元であればm個になります。(家賃の推定のように、m=1の場合もあります。) このシステムをニューラルネットワークで実装したとしても入口と出口は同様となります。下の図は、入力が多めで、出力は一次元の場合のイメージです。
image.png 15.84 KB
ですので、この記事を書き始めた当初は、一関高専さんも、下記のような入力が16個、出力が1個のモデルを使っているのかな?と想像していました。
image.png 4.91 KBでも松尾先生のコメントをよく聞くと、「利用時には首筋だけで測定できるようにした」ということですので、入力をもっと絞り込んでいる、ということですね。何個に絞ってるんだろう・・・真相判明したらまた追記します。できないかもですが・・・

あと、アーカイブビデオを見ていて気づいたのですが、RNNを使っていますね・・・ということは、WB度を時系列で観察して従業員の変化を知る、ということだと推測されます。(もしかすると、脈波も時系列で観察するのかもしれませんが・・・)真相判明したらまた追記したいと思います。できないかもですが・・・

■ 分類の事例

分類(classification)とは、あらかじめ分類先を決めておき、入力データを用いて対象を分類する行為です。「あらかじめ分類先を決めておく」とは、例えば「犬、猫のいずれ科に分類する」と決めておくことを指しています。

DCONでは、鳥羽商船 ezaki-labさんが分類を利用したソリューションを活用していると思われます。見ていきましょう。

8 鳥羽商船高等専門学校 ezaki-lab

・テーマ名・概要  (当日のプレゼンへのリンクはこちら
りぷら
プラスチックのリサイクルを正確に行うためのソリューション
スマホに独自開発のアタッチメントを接続し、反射光のヒストグラムから判別
判別処理をPP、PE、PVCに絞ることでコストダウン
image.png 303.37 KB
宿泊施設など、事前に何のプラごみが出てくるかわからない施設にニーズがあると想定しているとのことでした。

・松尾先生からの技術コメント(こちらのリンクで視聴できます)

- PP, PE, PVC, その他という4クラス分類問題
- 既存の製品で分光器を使ったものはあるが、そうではなくスマホを使う。ポイントはスマホが近赤外線の受像ができるということ
- もうひとつは色相を加えると更に精度が上がるということで、今までにないやり方

 ・もりさん想像
入力はヒストグラムということで、入力を数値データとする4クラス分類問題と思われます。そうだとすると、画像認識で用いるCNNではなく、シンプルなDNN or 他の教師あり学習で訓練可能な機構を用いているのではないかと思われます。DNNだとすると、出力層が4ノードで、確率で出力されるのかな?などと想像されますが、問題のシンプルさから考えるとSVNなのかもしれないと想像しています。

他方、入力は反射光のヒストグラムを用いている・・・上記の画像を見ると、各周波数の光の反射をスペクトル分解したものがグラフになっていますので、入力側のノード数はその分解能に依存するのではないかと・・・だとすると入力データの個数はちょっと想像つかないです。
image.png 23.22 KB筆者の想像。DNNならば出力層は4ノードだが・・・入力は何個なんだろう・・・?

ということで想像するのが精いっぱいで知りたいことだらけですが、特許出願中とのことですので、今はその結果を楽しみに待とうかと思います。

■ E資格の観点で復習

  では、ここまでで見てきた内容を、E資格の観点で復習してみましょう。

E資格シラバスの見直し
実は現在のE資格シラバスには、regressionの意味での回帰という言葉も、分類という言葉も現れません。しかし、教師あり学習で実現できる機能の代表例として回帰(regression)と分類(classification)を覚えておくことは必要だと思います。image.png 17.62 KB(E資格シラバス2022より抜粋、筆者が加筆修正)

回帰
回帰(regression)とは、入力データを元に、目的とする数値を推測する行為でした。DNNで実装するならば、典型的な形状は以下のようになります。なお、出力が多次元となる場合もあると思います。


分類
ちなみに、ひとつ前のシラバスE2020では、教師あり学習の具体的な手法として、ロジステック回帰、SVN、最近傍法やk近傍法が挙げられていました。実はこれらは全て「分類」の手法。きっと今でも勉強しておく必要があるのではないかな?と想像しています。
image.png 10.16 KB(E資格シラバス2020より抜粋)

また、入力データが数値データの場合、単純なDNNモデルで分類のタスクを行うことも可能です。以下は、4項目でできている入力データから、それがz1, z2, z3のいずれであるかを分類するモデルの例です。z1, z2, z3には、確率(可能性)が出力されます。image.png 34.21 KB図では、出力層の活性化関数にはSoftmax(ソフトマックス)関数を用いています。Softmax関数は、分類の出力層で用いる活性化関数として、最も典型的な関数のひとつです。分類にてSoftmax関数を用いるのは、出力データが、確率の条件である「0≦p≦1」かつ「合計値が1」という条件を満たすようにするためです。

Softmax関数は、深層学習の基礎としてシラバスに挙げられています。image.png 22.34 KB(E資格シラバス2022より抜粋)

■ 次回以降の予定

次回は物体検出、その次は音声処理、最後にVAE・XAIをテーマに、それぞれの技術を用いているチームのソリューションを紹介しようと思います。