ソフトウェアエンジニアのための機械学習によるデータ分析実践(9/3)

セミナー概要

日時:
2015年9月3日(木)
13:00-17:00(受付開始: 12:30)
会場:
国立情報学研究所 国立情報学研究所 20階 ミーティングルーム(2009/2010)
概要:
 収集・蓄積が可能なデータ量が増えたことで,このビッグデータからビジネスに有効な知見を発見(データマイニング)するための機械学習技術に注目が集まっています.オープンソースのツールなどが充実してきたことで,研究者や専門家でなくても機械学習技術を利用することが可能となってきており,ソフトウェアエンジニアにも機械学習によるデータ分析の知識が求められています.ツールやライブラリの使い方は,書籍やWeb上で詳しく解説されており,複雑な機械学習アルゴリズムでも簡単に利用することが可能になりました.

しかし,分析自体は簡単に行うことができても,分析前の準備,分析手法の選択,分析結果の評価など,分析プロセスに問題があると,適切な分析結果を得ることができません.

本セミナーでは,機械学習によるデータ分析のプロセスを実際に手を動かしながら学んでいきます(聴講だけでも問題ありません).

講義ではPythonとR,両方の例で説明しますので,どちらか好きな方(あるいは両方)で実際に分析をしていただくことができます.

当日会場に用意されたシンクライアントにて演習を行うことができますが,ご自身のPCで動かしてみたいという方は,以下の事前準備の説明に従い,演習に必要なソフトウェアとデータを準備してご持参ください.

※事前準備:
[ソフトウェア]
PythonもしくはRは,それぞれ,以下のライブラリを利用予定ですので,事前にお好きな方をインストールしておいてください(括弧内は動作確認したバージョン).セミナーではPython,Rの動作に関するご質問をお受けする時間がありませんのであらかじめご了承ください.

Python(2.7.10)
matplotlib(1.4.3), numpy(1.9.2), pandas(0.16.2), scipy(0.15.1)
scikit-learn(0.16.1), statsmodels(0.5.0)
および上記ライブラリの依存ライブラリ
※AnacondaというPython distributionだと一括導入できて便利です.

R(3.2.0)
caret(6.0.47), doMC(1.3.3), e1071(1.6.4), gbm(2.1.1), glmnet(2.0.2),
kernlab(0.9.20), nloptr(1.0.4), randomForest(4.6.10), rpart(4.1.9)
および上記ライブラリの依存ライブラリ
※IDEはRStudioが便利です

[データ]
以下のデータを利用しますので事前にPCにダウンロードしておいてください.
http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic3.csv
(Data obtained from http://biostat.mc.vanderbilt.edu/DataSets)

講師:
日立製作所 研究開発グループ 鴨志田 亮太
定員:
30名(先着順)
※定員に達し次第,申し込みを締め切らせていただきます。
参加費:
一般 3,000円/学生 1,000円
会員:1,000円(税込み)
※日本ソフトウェア科学会 会員の方も会員価格となります。
※NPO法人 トップエスイー教育センター会員及び日本ソフトウェア科学会会員の方は、優先的に受講いただけます。
参加申込方法:
参加申込みサイトより必要事項を入力の上、お申込みください。
http://ws.formzu.net/fgen/S53074529/
主催:
NPO法人 トップエスイー教育センター
協力:
国立情報学研究所 GRACEセンター
協賛:
日本ソフトウェア科学会 ソフトウェア工学の基礎研究会
お問合せ窓口:
セミナーに関するご質問などは、下記アドレスにて承ります。
inquiry_[at]_topse.or.jp ※_[at]_部分を@に変えてください

ソフトウェアエンジニアのための「機械学習理論」入門(6/26)

セミナー概要

日時:
2015年6月26日(金)
13:00-17:00(受付開始: 12:30)
会場:
国立情報学研究所 国立情報学研究所 20階 ミーティングルーム(2009/2010)
概要:
概要:
 機械学習のツールやライブラリがオープンソースとして利用可能になり、さまざまなビジネス領域で機械学習が活用されるようになりました。とりわけ、大規模データ分析や機械学習を組み合わせたアプリケーションの開発において、データ分析を専門としないソフトウェアエンジニアにも機械学習の知識が求められています。
 しかしながら、機械学習の背後にある「理論」を理解するための敷居はまだ高く、

・機械学習のツールやライブラリは内部でどのような計算をしているのか?
・計算で得られた結果にはどのような意味があり、どのようにビジネス活用すればよいのか?

という疑問を持つエンジニアが増えています。
 本セミナーでは、機械学習の基本的なアルゴリズムについて、その背後にある理論を解説した上で、Pythonで実装したアルゴリズムのサンプルコードを用いたハンズオンを行います。特に、ビジネス視点でのデータ活用となる「データサイエンス」を意識した解説を行い、ビジネス活用に向けた本格的な機械学習を学ぶ土台となる知識を提供します。

注意:本セミナーは、既存の機械学習ライブラリの使い方を説明するものではありません。機械学習ライブラリは用いずに、アルゴリズムを直接実装したコードで演習を行います。

前提知識:
高度な数学の知識がなくてもアルゴリズムの仕組みが理解できるように解説しますが、大学初等程度の微積分と確率統計の知識があるとより理解が深まります。また、Pythonの基礎知識があると、ハンズオンで提供するサンプルコードを理解するのに役立ちます。

使用予定資料:
・ソフトウェアエンジニアのための「機械学習理論」入門

・ハンズオン演習ガイド

タイムテーブル(予定):
13:00-13:10 オープニング
13:10-14:10 講義(前半)
14:10-14:20 休憩
14:20-15:20 講義(後半)
15:20-15:30 休憩
15:30-17:00 ハンズオン演習
講師:
レッドハット(株) シニアソリューションアーキテクト 中井 悦司
定員:
30名(先着順)
※定員に達し次第,申し込みを締め切らせていただきます。
参加費:
一般 15,000円/学生 8,000円
会員:4,000円(税込み)
※日本ソフトウェア科学会 会員の方も会員価格となります。
※NPO法人 トップエスイー教育センター会員及び日本ソフトウェア科学会会員の方は、優先的に受講いただけます。
参加申込方法:
参加申込みサイトより必要事項を入力の上、お申込みください。
http://ws.formzu.net/fgen/S17151523/
主催:
NPO法人 トップエスイー教育センター
協力:
国立情報学研究所 GRACEセンター
協賛:
日本ソフトウェア科学会 ソフトウェア工学の基礎研究会
お問合せ窓口:
セミナーに関するご質問などは、下記アドレスにて承ります。
inquiry@topse.or.jp

JSTMセミナー:仕様とテストを行き来してアジャイル・形式手法・テスト自動生成を考える(12/5,7)

セミナー概要

日時:
2014年12月5日(金),7日(日)
ともに9:30-17:30(受付開始: 9:00)
※5日と7日の内容は同一です。
会場:
国立情報学研究所 国立情報学研究所 20階 ミーティングルーム(2009/2010)
概要:
ますます困難となるソフトウェア開発の課題に対し,以下のように様々な立場・視点からの取り組みがなされています.
・ アジャイル開発のための,テスト(動作例)を軸としたテスト駆動開発やその発展手法
・ 厳密な言語による記述に基づく仕様の厳密化やツールによる検証(形式手法)
・ 様々な技法を用い系統的に行う品質保証テストやその自動生成ツール
これらの分野は互いに関係ない,時には相反するものだと見なされているかもしれません.しかし,これらの分野はすべて,

「ソフトウェアが実現すべき機能」を定義する,そしてその定義を用いて確かに実現がされていることを検証・確認する

という共通の課題に向き合っているものです.このため,これらの分野それぞれで積み上げられた技術や考え方は,元となる思想が異なるからこそ,互いの課題を解決する可能性があります.

本セミナーでは,ソルバー(モデル発見)ツールを用いて,「仕様を基にテストケース(動作例)を生成や確認する」,あるいは「テストケース(動作例)を基に仕様を確認する」演習を行います.この演習は上記の3つの分野にまたがって行うもので,それぞれの分野での上記課題に対する考え方への入門となるとともに,それら分野の相互関係・相互補完について広い視点から学び,議論する内容となります.

本セミナーで用いるツールは,情報処理推進機構(IPA)のソフトウェア工学分野の先導的研究支援事業(RISE)の委託研究により試作したものです.Java言語で書いたデータ構造やインターフェースの記述に対し,仕様や場合分けのヒント,動作例などを付加することで,手軽にソルバー(モデル発見)の技術を,インクリメンタルに,インタラクティブに活用できるようになっています.

【注意事項】
・ ツールをインストールしたWindows PCを用意する予定です.
・ テスト駆動開発(TDD)やその発展(受け入れテスト駆動開発ATDDなど),VDMやAlloyなどの形式仕様記述手法,PICTなどのテスト自動生成ツールなどの知識・経験があれば,より理解が深まりますが,必須ではありません(これらの分野への導入をしつつ,相互の関係について考える内容となっています).

講師:
・石川 冬樹 准教授(国立情報学研究所)
定員:
35名(先着順)
※定員に達し次第,申し込みを締め切らせていただきます。
参加費:
無料
※NPO法人 トップエスイー教育センター会員の方は、優先的に受講いただけます。
参加申込方法:
参加申込みサイトより必要事項を入力の上、お申込みください。
http://ws.formzu.net/fgen/S57176756/
主催:
NPO法人 トップエスイー教育センター
協力:
国立情報学研究所 GRACEセンター
お問合せ窓口:
セミナーに関するご質問などは、下記アドレスにて承ります。
inquiry@topse.or.jp