大阪イノベーションハブでデータサイエンスセミナー&交流会を開催させていただきます!
4月から大阪でスタートする、AI、IoT分野での新たなソリューション開発を目指す「アクセラレーターkansAI0.6」の募集説明も実施しますので、ご興味がおありの方はふるってご参加くださいませ。 セミナー詳細及び参加お申込みは下記より! https://soleildatadojo.doorkeeper.jp/events/69375 昨日23日(土)で第4期黒帯編が終了しました。 黒帯編では、ニューラルネットワークの基礎からtf.Kerasでの実装、Tensorboardでの学習状況や各パラメータの可視化、VGG16など既存の学習済みモデルを活用した転移学習、そして三日目にはベイズ統計学などについて取り扱いました。また最後のコマでは、2週間で取り組んでいただいたグループ課題の成果を発表いただきました。 今回の課題は、人事データをもとに離職者を予測するモデルを生成するというもので、モデルの精度だけではなく、「説明変数と目的変数の関係性を可視化し、適切な説明変数を選択できているか」といった分析を進める上でのプロセスがきちんと踏まれているかという点にも留意していただきました。 各グループ2週間という限られた時間の中でこれまで学んだことを色々と試行錯誤しておられ、大変興味深い発表でした。 これで、10月から始まった白、茶、黒帯編の全9日間が終了です。 ご参加いただいた受講者の皆さま、誠にありがとうございました。 終了後は、前回の3期生の方も交えて懇親会を行い、さまざまな企業、業界における今後のデータ活用方法などについて話が盛り上がりました。
本講座ではあくまでデータ分析の基礎を学んだだけで、まだまだデータ分析者としての入り口に立ったばかりの段階です。 それを実際にビジネスやご自身の研究で活用するところまで持っていかれるのは受講者皆様の個々の継続的な取り組みに掛かっております。 4−6月の第3期、10−12月の第4期とさまざまな業種、企業の方がご参加いただきました。修了生で有志の勉強会なども開催されており、徐々に緩やかなネットワークができつつあるようです。 今後は研究会なども企画開催し、企業や現場でデータで付加価値を産んでいくノウハウや課題などについて議論・情報共有できる場も増やしていければと思っております。 そうした地道な取り組みの中から一つ二つでも成功事例が出てきて、関西の他の企業に伝播し、足元から生産性や経営効率の向上につながっていけばと期待しております。 来年もよろしくお願いいたします。 茶帯編3日間の講義では、機械学習の理論と実装を中心に学習をしていきました。 初日は白帯編の初日でも学んだRapidMinerを使って、さらに実際のデータに対し、どう前処理やモデリング、精度評価をしていくのかという過程を学びました。まずノンプログラミングでデータ分析の流れをトレースするという作業を踏まえることで、2日目以降、Pythonでモデル実装する過程の全体像を理解しやすくすることを意図しています。 2日目以降は、回帰問題、時系列問題、分類問題、識別問題という課題設定に応じて選択すべき機械学習の手法やモデルについてアルゴリズムの仕組みをよく理解した上で、Pythonで実装していくという演習に取り組んでいただきました。 これらの手法が大まかに頭に入ってくると、実際のデータに適用するとどうなるのかということが気になってきます。この理論から実践へとハシゴを掛けるところがデータ分析者への道を歩むための最初の関門の一つです。 K-meansも決定木もランダムフォレストも何となく理解できたけど、いつどんな時に使ったらいいんだろう、それって本当のビジネスで役に立つの?といった疑問がフツフツと湧いてきます。 学んだ知識を現実のビジネスに活用するという次のフェーズを徐々に意識していただくため、3日目の最後のコマでは、データ分析プロジェクトをレビューするというテーマで、あるデータ分析プロジェクトの事例をもとに、参加者同士で真の課題や社内のどういったデータが使えそうか、適用すべきモデルが何か、その分析が本当にビジネス上有用なのかといったことについて議論する場を設けました。 12月から始まる黒帯編では、実際のデータを使ってデータ分析プロジェクトを設計し、顧客に対する最終プレゼンを行うという形式のグループ課題に取り組んでいただきます。
茶帯編にご参加いただいた受講者の皆さま、どうもありがとうございました。黒帯編でもよろしくお願いいたします。 11月4日(土)、5日(日)は岡山理科大学の大田靖先生を講師にお招きし、『事例で学ぶ!ビジネスデータ分析実践・R編』を開催しました。
丸二日間大変熱のこもった講義で、質的変数と量的変数をどう扱うかという分析初心者がつまずきやすいポイントを分かりやすく整理しながら、平均値・中央値・最頻値、分散、標準偏差、共分散、相関係数、正規分布、t分布、t検定、f検定、分割表、オッズ比、カイ二乗検定など統計学の基本的な考え方への本質的理解を深めていきました。 さらにR StudioとRコマンダーを使って、対応分析、主成分分析、回帰分析、重回帰分析、ロジスティック回帰分析、クラスター分析などの手法を実際のデータにどう適用し、そこから何を解釈するか、ビジネス的にどういった事例が想定しうるかといったところまで話は展開し、理論と実践にしっかりとハシゴが掛かりました。 Pythonに押され気味で、Rはやや注目度が薄れつつありますが、統計に特化しているという点で非常に優位性があるツールであると感じました。 今後もPythonと並行して、Rを使った講座や勉強会も企画開催し、適材適所でそれぞれの良さをうまく組み合わせて有効な分析ができる事例を紹介していければと考えております。 ご参加いただいた皆様、誠にありがとうございました。 白帯編最終日となる10月28日(土)の三日目は、小縣解析事務所の小縣信也氏が講師で、統計学の基礎を講義しました。
分散、標準偏差の辺りまではよいですが、共分散、正規分布、統計的仮設検定(t検定、f検定)のところまで来るとだんだんと受講者の方々の表情が曇ってきます。統計学になじみのない方にとっては毎回ハードルとなるこの部分の説明を、Jupyter Notebookを実際に使って手を動かしながら、ひとつひとつ理解を深めていきました。さらに回帰分析、最小二乗法、決定係数といったところまでを確認し、白帯編全3日間の講義は終了です。 最後の一コマでは、先週から取り組んでいただいたグループ発表の場です。PythonのPandasやMatplotlib、Seaborn、Bokehなど覚えたてのデータ分析ライブラリを早速駆使して、それぞれ自由なテーマでデータを取得し、前処理・可視化をしてきていただいた結果を発表いただきました。 それぞれ面白い観点での考察を加えられており、非常に興味深かったです。 白帯編ご参加いただいた皆様、誠にありがとうございました。 次月11月11日(土)からは茶帯編がスタートします!茶帯編では機械学習を主に取り扱います。 白帯編を受講されていない方でも受講いただけますので、ぜひ受講ご検討くださいませ。 講座詳細及びお申込みは下記より。 https://soleildatadojo.doorkeeper.jp/events/66555 クレジット・コンビニ決済ご希望の方はこちら。 http://chaobi4th.peatix.com/ 本日10月14日(土)よりデータ分析教育講座白帯編スタートしました。
初日は株式会社KSKアナリティクスの北島聡氏を講師にお招きし、RapidMinerによるノンプログラミングでの機械学習のモデリング、学習、性能評価など一連の流れを体感していただきました。 この先茶帯・黒帯編と主にPython、TensorFlowで機械学習やディープラーニングの実装を進めていきますが、基本的なモデリングの手順はほぼ共通しており、初日にその流れをグラフィカルなイメージとして掴んでいただくと後々の理解の助けとなります。 そうした意図もあって細かいアルゴリズムの説明等は抜きにしてまずはデータ分析の具体的な手順を丸一日でざっとトレースしていただきました。 次週2日目はJupyter Notebookを使って、Pandas、Numpy、Matplotlibなどのデータ分析ライブラリの使い方をレクチャーさせていただきます。 9月16日(土)に標記のセミナーを開催させていただきました! 今回は「AIビジネス化とその課題」をテーマに4名のご講演者の方をお招きし、台風18号が接近する中にも関わらず、約80名の方にご参加いただきました。 お一人目の登壇者・STORIA法律事務所の柿沼太一弁護士より、「これ大丈夫なのかな?」と皆さん不安に感じながらもネット上から学習データを集めたり、モデルを生成したりしているAIの著作権問題について、現在の法律でどのように解釈しうるかを概説していただきました。AIが生成したキャラクターに著作権は認められるかという問題も、類似性と依拠性という2点によって判定されるという概念整理など大変興味深い内容でした。 お二人目は、弁理士で株式会社Toreruの代表取締役でもある宮崎超史氏にご登壇いただき、ご自身が提供されている商標登録サイト「Toreru」のディープラーニング技術を活用した類似商標検索サービスについてご紹介いただきました。「公開データと非公開データ」、「公開アルゴリズムと非公開アルゴリズム」という2軸で、AIサービスの差別化の可能性を検討した論点は非常に刺激的でした。 三人目は、京都大学の古屋俊和氏です。古屋氏は、大学院在学中から積極的にAI技術のビジネス化にも参画され、株式会社エクサインテリジェンスの立ち上げにも深く関わっておられます。ご講演では、これからの発展が注目されるAIの4つの最新技術やデータサイエンティストに必要な資質、医療やスポーツなどの分野でのサービス化事例など幅広い観点でご紹介いただきました。 最後は、東京のAIベンチャー・CogentLabのCEO・飯沼純氏にご登壇いただきました。飯沼氏は、セールスフォース・ドットコムの草創期から今日までの急成長の過程をつぶさに見るというビジネス経験を経て、満を持して創業され、このほどAI日本語手書きOCR「Tegaki」をリリースされました。AI技術をサービス化するには徹底的に「現場に足を運び、顧客の声を聞く」ことが重要であるという熱いメッセージが大変印象的で、それらの声を生かしTegakiの細部に至るまでユーザーエクスペリエンスにこだわった仕様になっていることに感銘を受けました。
講演終了後は、約40名の方が交流会で大変熱心に議論や意見交換をされていました。 ご参加いただいた皆様及び講演者の方々、誠にありがとうございました。 今後もこうしたセミナーや教育講座等を企画開催してまいりますので、ご興味がおありの方は是非ご参加くださいませ! セミナーや教育講座等のご案内は下記にて行っております。 https://manage.doorkeeper.jp/groups/soleildatadojo 昨日6月24日(土)で黒帯編3日目が終了し、4〜6月の3ヶ月間にわたる第3期データ分析教育講座が無事終了いたしました。 白帯編23名、茶帯編22名、黒帯編21名の方にご参加いただきました。 今回は茶帯編・黒帯編と2ヶ月間にわたって、受講者の方からご提案いただいた4つの分析プロジェクトにグループごとに取り組んでいただきました。 茶帯編では分析提案書の作成、黒帯編では分析報告書の作成という2つのフェイズに区切ってそれぞれ最終日の最終コマで発表するという流れでした。 データ分析をしたことのある方でしたら皆様ご経験かと思いますが、ただ一方的に講義形式で分析手法やプログラミングの実装例を学んでも、まったくデータ分析をできるようにならない、やはり現実の、生のデータに立ち向かって泥臭く前処理・基礎集計などの工程を経ることで、ようやく少しずつデータ分析力が身に付いていくということです。 そして、もう一つ重視したことはグループワークです。社会人としてさまざまなバックボーンをお持ちの方々がお互いのこれまでの経験や知識を寄せ、お互いに議論・刺激し合うことで、より学びを深まったのではないでしょうか。 最終報告は、4グループとも非常に充実した内容で、そのまま実際の業務へと展開したり、ビジネス価値を創出するようなものでした。
3ヶ月間土曜9日間を捧げ、かつ分析プロジェクトのために休みや平日の夜の時間も費やし、なかなかハードだったとのお声もいただきましたが、受講者同士で今後も交流を続け、さらに切磋琢磨して分析力を磨いていく場を提供して欲しいとの声も多数いただきました。 ぜひ今回の講座で身につけた武器を活かし、分析者的態度で地域やビジネス課題の解決へとチャレンジしていっていただきたいと思います。 ご参加いただいた受講者の皆様、誠にありがとうございました。 秋からまた第4期を開講する予定ですので、ビジネス現場で実際に活用できるデータ分析力を身に付けたい方はぜひご受講ご検討くださいませ。 受講募集&講座案内は、またDoorKeeperページで後日公開させていただきます。 本日5月27日(土)で茶帯編全3日間のプログラムが終了しました。
茶帯編では、識別問題、予測問題、時系列問題、最適化問題など、機械学習のアルゴリズムを中心に、Python(一部R)を使って実際に手を動かしながら実装するという形で学習を進めてきました。 また受講者の皆様から分析課題を募り、ご提案いただいた4つの分析プロジェクトで4チームに分かれ、2週間にわたってクライアントを想定した分析提案書を作成するというグループ課題にも取り組んでいただきました。単に一方的に講義を聞いて終わりでなく、得た知識を直ちに実際の課題に応用し、より学びを深めていただきます。(しかもチームでやるので真剣!) 分析データもヘルスデータ、上場企業の財務データ、フルーツトマトの生育データ、ファッション画像データと多種多様で、分析目的も異なり、受講者の皆様大変熱心に取り組んでいただき、2週間で作り上げたとは思えないハイレベルな発表となりました。さらに進めていけばビジネス的にも価値の高い分析となりそうです。 黒帯編では、この4つの分析プロジェクトを継続し、2週間でクライアントへの分析報告書を作成するというグループ課題に取り組んでいただく予定です。 また講義内容としては、ニューラルネットワークやベイズ統計といったところへと足を踏み入れていきます。 黒帯編までの全9日間が終わった時点で、受講者の方々がそれぞれの実務や研究で、データ分析者としての一歩を踏み出していただけるよう、少しでも質の高いプログラムを提供していきたいと思います! 本日5月13日(土)より、茶帯編がスタートしました。
茶帯編は22名の方にご受講いただき、初日の本日は小縣解析事務所の小縣信也氏が講師で、午前中は機械学習でよく出てくる数式記号の説明から、最尤推定法や重回帰分析の多重共線性、ステップワイズ法による変数選択、AIC、BIC、偏微分、導関数などの説明です。 午後は時系列解析について、移動平均法、指数平滑法などの説明をし、最後の一コマではグループ課題のプレゼンとチーム分けを実施しました。 今回受講者の方から募集して分析テーマをご提案いただき、ファッション画像データ、上場企業の決算データ、フルーツトマトの生育データ、ウェアラブル端末のヘルスケアデータなど異なる種類のデータが出そろいました。なかなか入手し難い貴重なデータもあり興味深いです。 茶帯編の2週間で分析提案書の作成に取り組んでいただき、3日目の最終コマで各グループ発表していただきます。 どのようなアウトプットが出てくるか非常に楽しみです! |
Archives
December 2018
Categories |
Powered by
Create your own unique website with customizable templates.
