セミナー概要
13:00-17:00(受付開始: 12:30)
しかし,分析自体は簡単に行うことができても,分析前の準備,分析手法の選択,分析結果の評価など,分析プロセスに問題があると,適切な分析結果を得ることができません.
本セミナーでは,機械学習によるデータ分析のプロセスを実際に手を動かしながら学んでいきます(聴講だけでも問題ありません).
講義ではPythonとR,両方の例で説明しますので,どちらか好きな方(あるいは両方)で実際に分析をしていただくことができます.
当日会場に用意されたシンクライアントにて演習を行うことができますが,ご自身のPCで動かしてみたいという方は,以下の事前準備の説明に従い,演習に必要なソフトウェアとデータを準備してご持参ください.
※事前準備:
[ソフトウェア]
PythonもしくはRは,それぞれ,以下のライブラリを利用予定ですので,事前にお好きな方をインストールしておいてください(括弧内は動作確認したバージョン).セミナーではPython,Rの動作に関するご質問をお受けする時間がありませんのであらかじめご了承ください.
Python(2.7.10)
matplotlib(1.4.3), numpy(1.9.2), pandas(0.16.2), scipy(0.15.1)
scikit-learn(0.16.1), statsmodels(0.5.0)
および上記ライブラリの依存ライブラリ
※AnacondaというPython distributionだと一括導入できて便利です.
R(3.2.0)
caret(6.0.47), doMC(1.3.3), e1071(1.6.4), gbm(2.1.1), glmnet(2.0.2),
kernlab(0.9.20), nloptr(1.0.4), randomForest(4.6.10), rpart(4.1.9)
および上記ライブラリの依存ライブラリ
※IDEはRStudioが便利です
[データ]
以下のデータを利用しますので事前にPCにダウンロードしておいてください.
http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic3.csv
(Data obtained from http://biostat.mc.vanderbilt.edu/DataSets)
※定員に達し次第,申し込みを締め切らせていただきます。
会員:1,000円(税込み)
※日本ソフトウェア科学会 会員の方も会員価格となります。
※NPO法人 トップエスイー教育センター会員及び日本ソフトウェア科学会会員の方は、優先的に受講いただけます。
http://ws.formzu.net/fgen/S53074529/
inquiry_[at]_topse.or.jp ※_[at]_部分を@に変えてください