近藤悠介・石井雄隆. (2017). 「英語学習者の発話自動採点システムの開発と英語教育プログラムへの導入可能性の検討」『Language Education & Technology』54. 23-40.




Performance assessment attracts rising attention in recent English language education, but little has been introduced to English language program in Japan. This is because such assessment imposes severe burdens on instructors: conducting interview, rating students' performance, and analyzing and delivering scores. An automated scoring system for students' performance can be a solution to this problem. To present the solution, we developed an automated scoring system for speech by Japanese learners of English and examined the practicality of the system in an English language program. The system assesses the students' responses to the discourse completion tasks that were created to elicit the expressions learned in the lessons. The responses are represented as vectors applying the bag-of-words model, and the system scores the response using Support Vector Machine and Naive Bayes Classifier. The accuracy of these two prediction methods is estimated using cross-validation. The exact agreement is 74% between our system and the human scores.
















・本研究では、小学校での外国語の教科化に向け、データ駆動型学習(Data-Driven Learning: DDL)を活用して文法指導を行い、中学校での英語教育への橋渡しを試みた。


杉田由仁・石井雄隆(2017)「タスクに基づくライティングテスト自動評価採点システムにおける客観的評価指標の検討 (2)」全国英語教育学会第43回島根研究大会.


・本研究では、タスクに基づくライティングテスト (Task-based writing test: TBWT) に特化した「コンピューターによる自動評価採点システム」の開発を進めている。第1次から第3次までの研究において、ライティング評価を予測する言語的特徴として抽出された客観的評価指標 (特徴量) により、総合評価を61~69%予測できる回帰式を作成することができた。しかし、予測精度をより向上させるために、1) Accuracy タスクの「言語的正確さ」の評価において、語彙や文法、スペル句読法などにおける誤りを特定し、統計指標化する方法を考案すること、2) Communicability タスクの「情報伝達効果」の評価において、課題との関連性を判定し統計指標化する方法を考案する必要性が示唆された。そこで本研究では、それぞれの評価規準をより適切に指標化する方法を考案・適用して総合的評価を予測する回帰式を作成し、その回帰式の有用性について検討を行った。


Ishii, Y., Sawaki, Y., & Tahara, T. (2017). An analysis of Japanese EFL learners’ reading-to-write task completion process: Triangulation of stimulated recall and keystroke logging data sources. The 21st Annual Conference of the Japan Language Testing Association.


Reading-to-write tasks require learners to summarize and paraphrase ideas represented in source texts. The importance of such tasks in fostering learners’ English language ability for academic purposes has been recognized by practitioners and researchers of EFL in Japan because such tasks elicit learner performance reflecting authentic language use in academic settings. Moreover, the employment of skill-integrated language use activities including reading-to-write tasks in English language instruction has become a central issue in the development of the next version of the course of study for grade schools by the Ministry of Education, Culture, Sports, Science and Technology (MEXT) as well as the currently on-going reform of university entrance examinations in Japan. Accordingly, it is imperative to elucidate the process learners engage while responding to reading-to-write tasks. As an example, Barkaoui (2015) investigated the process of completing integrated and independent writing tasks in his stimulated recall study. Barkaoui’s results revealed various construct-relevant activities that learners engage during the process of task completion such as interacting with the writing task and sources, planning, generating, evaluating, and revising for ESL learners. In the Japanese EFL context, however, little is known about learners’ strengths and weaknesses of their reading-to-write task performance. As an attempt to address this gap, the present study examined activities learners engage during the process of completing reading-to-write tasks by combining stimulated recall and keystroke logging for a fine-grained analysis of learners’ writing process from multiple perspectives (Lindgren & Sullivan, 2003).

Participants in this study were five undergraduate students majoring in English language and literature at a private university in Tokyo. Each learner read an English text and wrote a summary of it in approximately 80 words. To explore the learners’ writing process this study employed a keystroke-logging program, WritingMaetriX (Kusanagi, Abe, Fukuta, & Kawaguchi, 2014), which can record, analyze, and replay learners’ writing process. Upon completion of the summary task, a stimulated recall session was conducted, where the video of the learner’s task completion process and the replay of the learner’s keystroke logging were employed as prompts. Data on trends and frequencies of different activities observed in the keystroke logging data were analyzed in conjunction with stimulated recall data. In this presentation the presenters will summarize the key study results and implications of the findings for teaching, learning and assessment as well as future directions of this research.





本稿では,実践共同体の形成を目的としたファカルティデベロップメント(Faculty Development,以下FD)の概要について報告する.筆者らが所属する早稲田大学大学総合研究センターでは,教員へのFDプログラムとして,海外FD研修,オンデマンドFD研修,対面FD研修に加えて,学部生と大学院生で構成される高度授業TAとの協働を行っている.それらの取組みの概要と評価結果について紹介し,最後に,本実践における課題について言及する.











An approach to research in the social, behavioral, and health sciences in which the investigator gathers both quantitative (close-ended) and qualitative (open-ended) data, integrates the two, and then draws interpretations based on the combined strengths of both sets of data to understand research problems. (Creswell, 2014, p. 2)



簡潔に定義すると,量的なデータと質的なデータを組み合わせて行う研究法の一つであり,近年では応用言語学でも注目を集めつつある。例えば,Megnan (2006)の調査によると,Modern Language Journalにおける1996-2005年の論文の中では,10年間で11本(6%)しか報告されていなかったのに対し,Tojo and Takagi (2017)によるTesol Quarterly,Applied Linguistics,Modern Language Journalの2006-2015年の論文の調査によると,3誌合計で100本(13%)の研究においてmixed methodsが利用されている。


同様に,Hashemi and Babaii (2013)は1995年から2008年に刊行されたApplied Linguistics,English for Specific Purposes,Language Learning,language Testing,Modern Language Journal,Tesol Quarterly,Language Teaching Researchの論文の中で205本が混合研究法のデザインで行われているという報告をしている。またRiazi and Candln (2014)では,2002年から2012年に国際誌で刊行された論文を調査し,40本の論文に焦点を当てた調査を行っている。


国内の動向に目を向けると,外国語教育系学会で出版されている論文誌の調査がいくつか存在する(Mizumoto, Urano, & Maeda, 2014; Stapleton & Collett, 2010; 寺沢, 2010山本, 2013)。


Mizumoto, Urano, and Maeda (2014)では全国英語教育学会が刊行しているAnnual Review of English Language Educationの24年分の出版された論文を調査した。その結果,ここ12年で混合研究法が増えていることがデータより読み取れる。また,Stapleton and Collett (2010)は全国語学教育学会が刊行しているJALT Journalにおけるここ30年分の論文を調査し,同様に混合研究法の論文が増加していることを報告している。


また山本(2013)では,外国語教育メディア学会が発行しているLanguage Education & Technologyの2003年から2013年の論文を調査し,質的研究と混合研究法が100本の論文の内,25パーセントを占めていると報告している。それに加えて,そのうちのほとんどがトライアンギュレーションモデルと呼ばれるデザインで行われているという事を報告している。


関連して,寺沢(2010)は,大学英語教育学会の学会誌JACET Journalの1970年から2004年の方法論及びトピックを調査している。その結果,質的な実証研究が少ないことを報告している。また「計量的な実証研究が非常に多く,そうしたタイプの研究が学術的 prestige を得やすく,そのような知的傾向が前提になりつつあるということ」や,「学習者の内的なメカニズムに焦点化した実証研究が非常に多い」ことを報告している。*1


Creswell (2014, p. 24)は,下記のように述べている。


Graduate students enter my mixed methods course after they have completed classes on statistics and quantitative designs (e.g., experimental designs) and one or two qualitative research classes.






Creswell, J. W. (2014). A concise introduction to mixed methods research. Sage Publications.


Hashemi, M. R., & Babaii, E. (2013). Mixed methods research: Toward new research designs in applied linguistics. The Modern Language Journal, 97(4), 828-852.


Magnan, S. S. (2006). From the editor: The MLJ turns 90 in a digital age. The Modern Language Journal, 90(1), 1-5.

Mizumoto, A., Urano, K., & Maeda, H. (2014). A systematic review of published articles in ARELE 1–24: Focusing on their themes, methods, and outcomes. ARELE (Annual Review of English Language Education in Japan). 25, 33–48.


Riazi, A. M., & Candlin, C. N. (2014). Mixed-methods research in language teaching and learning: Opportunities, issues and challenges. Language Teaching, 47(2), 135-173.

Stapleton, P., &Collett, P. (2010). Perspectives: JALT Journal Turns 30: A Retrospective Look at the First Three Decades. JALT Journal. 32(1), 75-90.


Tojo, H., & Takagi, A. (2017). Trends in Qualitative Research in Three Major Language Teaching and Learning Journals, 2006–2015. International Journal of English Language Teaching, 4(1), 37-47.


寺沢拓敬(2010, November 2). 教育研究としての『外国語教育学』 [Web log post]. Retrieved from


山本長紀(2013)「方法論的トライアンギュレーションを考える:Language Education & Technology掲載論文における量的・質的データ分析の混合」外国語教育メディア学会関西支部メソドロジー研究部会2013年度第3回研究会発表資料.



石井雄隆. (2016). 『「対話型,問題発見・解決型教育」導入のための手引き』早稲田大学大学総合研究センター教育方法研究開発部門


Ishii, Y. (2016). Investigating Co-occurrence Patterns of Learners’ Grammatical Errors Across Proficiency Levels and Essay Topics Based on Association Analysis. In S. ElAtia, D. Ipperciel., & O. Zaiane. (Eds.), Data Mining and Learning Analytics: Applications in Educational Research (pp. 157-171). John Wiley & Sons. [査読有]


Data Mining and Learning Analytics: Applications in Educational Research (Wiley Series on Methods and Applications in Data Mining)

Data Mining and Learning Analytics: Applications in Educational Research (Wiley Series on Methods and Applications in Data Mining)




石井雄隆. (2016a). データマイニングで英語教育はこう変わる!:「データに基づいた教育改善を目指して―エデュケーショナル・データマイニング入門―」(連載第1回)『英語教育』(大修館書店)4月号. 64-65.


石井雄隆. (2016b). データマイニングで英語教育はこう変わる!:「英作文に隠された文法的誤りのパターンを探る―アソシエーション分析―」(連載第2回)『英語教育』(大修館書店)5月号. 64-65.


石井雄隆. (2016c). データマイニングで英語教育はこう変わる!:「英語学習者のライティング・プロセスの解明―キー入力記録を用いたプロセスの可視化―」(連載第3回)『英語教育』(大修館書店)6月号. 64-65.


石井雄隆. (2016d). データマイニングで英語教育はこう変わる!:「人工知能は英語学習者の能力を測定できるか―自動採点・評価研究の最前線―」(連載第4回)『英語教育』(大修館書店)7月号. 64-65.


石井雄隆. (2016e). データマイニングで英語教育はこう変わる!:「大規模公開オンライン講座・MOOCの潮流―学習者のビッグデータに基づく教育改善や新たな教育手法の開発―」(連載第5回)『英語教育』(大修館書店)8月号. 66-67.


石井雄隆. (2016f). データマイニングで英語教育はこう変わる!:「教育データサイエンスの構築に向けて―新たな評価・研究のパラダイム―」(連載第6回)『英語教育』(大修館書店)9月号. 64-65.


石井雄隆・ゴードンアダム・平賀純・永間広宣・大浦弘樹・森田裕介. (2016). 「グローバルMOOCにおける相互評価の信頼性に関する検討-早稲田大学における事例から-」. 日本教育工学会研究報告集. JSET16-3, 155-160.


草薙邦広・石井雄隆. (2016). 「量的研究の最前線―ベイズ統計とデータマイニング―」. 『第42回全国英語教育学会埼玉研究大会発表予稿集』. 538-539.


Kondo, Y., & Ishii, Y. (2016). What can programming language do for our analysis? : The usefulness of jupyter notebook in the analysis of language testing. Proceedings of the 21st International Conference of Pan-Pacific Association of Applied Linguistics. 55-56.


福田純也・石井雄隆. (2016). 「中国語を第一言語とする日本語学習者の作文に対する日本語教師の評価―一般化可能性理論を用いた検討―」『日本教科教育学会誌』35(2). 81-89. [査読有]



石井雄隆. (2016a). 「ラーニングアナリティクスと教育クラウド」. 早稲田大学理工学研究所特別研究「次世代e-learningに関する研究」部会. 第6回次世代eラーニングに関する研究ワークショップ. 伊藤園ホテル熱海館. [招待]


石井雄隆. (2016b). 「データマイニングと外国語教育の接点としての自動採点研究」. 早稲田大学CCDL研究所第1回シンポジウム「外国語教育研究におけるスピーキングとライティングの自動採点・評価」. 早稲田大学. [シンポジウム]. [招待]


近藤悠介・石井雄隆. (2016a). 「コンピュータによる発話自動採点の導入可能性を考える: MyETの利用調査」. 外国語教育メディア学会関西支部春季大会. 神戸学院大学.


石井雄隆. (2016c). 「早稲田大学におけるグローバルMOOCの展開-edXコースの開発・運営と学習データ解析-」2016年度第2回DCC産学交流フォーラムedx講座第一弾実施報告会. 早稲田大学. [招待]


草薙邦広・石井雄隆. (2016a). 「外国語教育のアカウンタビリティとデータ分析の規格化および自動化:問題整理とツール開発」 . 第46回中部地区英語教育学会三重大会. 鈴鹿医療科学大学.


石井雄隆・ゴードンアダム・平賀純・永間広宣・大浦弘樹・森田裕介. (2016). 「グローバルMOOCにおける相互評価の信頼性に関する検討-早稲田大学における事例から-」. 日本教育工学会研究会. 鳴門教育大学.


石井雄隆. (2016d). 「エデュケーショナル・データマイニング入門―教育改善・意思決定のためのデータ活用―」. 外国語教育メディア学会第56回全国研究大会. 早稲田大学. [ワークショップ]. [招待]


草薙邦広・石井雄隆. (2016b). 「量的研究の最前線―ベイズ統計とデータマイニング―」. 全国英語教育学会第42回埼玉研究大会. 獨協大学. [ワークショップ]. [招待]


Kondo, Y., & Ishii, Y. (2016b). What can programming language do for our analysis? : The usefulness of jupyter notebook in the analysis of language testing. The 21st conference of Pan-Pacific Association of Applied Linguistics. Tamkang University, Taiwan.


石井雄隆. (2016e). 「アクティブ・ラーニングについて考える」. 外国語教育研究の未来. 外国語教育メディア学会関西支部メソドロジー研究部会2016年度第2回研究会(共催). 広島大学.


石井雄隆. (2016f). 「エデュケーショナル・データマイニング入門―データに基づく言語教育を目指して―」. 言語教育とデータ分析に関する連続ワークショップ. 早稲田大学. [ワークショップ]. [招待]


石井雄隆. (2016g). 「データマイニングを活用した英語ライティング研究」. 大学英語教育学会英語辞書研究会例会. 早稲田大学. [招待]


石井雄隆. (2016h). 「Rによるエデュケーショナル・データマイニング(EDM)入門ワークショップ」. ERMS(Enrollment and Retention Management System) 研究会. 宝塚大学東京新宿キャンパス. [ワークショップ]. [招待]


石井雄隆. (2016i). 「小中高大におけるアクティブ・ラーニングの展開-早稲田大学の事例から-」. 外国語教育メディア学会中部支部第88回支部研究大会. 鈴鹿中学・高等学校 [招待]


石井雄隆・長谷川佑介・山内優佳・福田純也・川口勇作. (2016). 「若手研究者が考える四技能指導の理論と実践」. 外国語教育メディア学会中部支部外国語教育基礎研究部会. 名城大学. [シンポジウム]. [招待]


石井雄隆. (2016j). 「早稲田大学における教育ビッグデータの利活用-グローバルMOOCの取り組み-」. 早稲田大学理工学研究所特別研究「次世代e-learningに関する研究」部会. 第8回「次世代e-learning」公開フォーラム(2016年度第5回DCC産学交流フォーラム). 早稲田大学.


Bousia, N., & Belamri, I. (2013). Which Contribution Does EDM Provide to Computer-Based Learning Environments? In A. Peña-Ayala (Ed.), Educational Data Mining Applications and Trends (pp. 3-28). Springer.


石井雄隆 (2015).「データマイニングの手法を用いた英語ライティングへのアプローチ -日本人英語学習者のエッセイ評価に影響を与える文法的誤りパターンの検討」EIKEN BULLETIN, 27, 28-39.

Romero, C., & Ventura, S. (2013). Data mining in education. Data Mining and Knowledge Discovery, 3(1), 12–27.


Siemens, G., & Baker, R.S. (2012). Learning Analytics and Educational Data Mining: Towards Communication and Collaboration. Proceedings of the 2nd international conference on learning analytics and knowledge.




Ishii, Y. (in press). Investigating Co-occurrence Patterns of Learners’ Grammatical Errors Across Proficiency Levels and Essay Topics Based on Association Analysis. In S. ElAtia, O. Zaiane & D. Ipperciel (Eds.), Data Mining and Learning Analytics: Applications in Educational Research. Wiley & Blackwell.


Krüger, A., Merceron, A., & Wolf, B. (2010). A data model to ease analysis and mining of educational data. In M. Pechenizkiy et al. (Eds.), Proceedings of the 3rd International Conference on Educational Data Mining 2010, pp.131–140. Eindhoven, The Netherlands: International EDM Society.


Nagata, R. Whittaker, E., & Sheinman, V.(2011). Creating a manually error-tagged and shallow-parsed performance learner corpus. Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, pp.1210-1219. Portland, OR.

Romero, C., Romero, J. R., Luna, J. M., & Ventura, S.(2010). Mining Rare Association Rules from e-Learning Data. In Proceeding of The Third International Conference of Education Data Mining, pp. 171-180. Pittsburgh, USA.




Deane, P. (2014). Using writing process and product features to assess writing quality and explore how those features relate to other literacy tasks. ETS Research Report Series, 2014(1), 1-23.


石井雄隆・石井卓巳・川口勇作・阿部大輔・西村嘉人・草薙邦広 (2015).「Writing MaetriXを用いた言語資源の構築と英語学習者のライティング・プロセスの解明」『外国語教育メディア学会第55回全国研究大会予稿集』190-193.


草薙邦広・阿部大輔・福田純也・川口勇作 (2015). 「学習者のライティングプロセスを記録・可視化・分析する多機能型ソフトウェアの開発: WritingMaetriX」『LET中部支部研究紀要』26,23–34.


尾関修治(1993)「ハイパーメディアにおける学習履歴の記録とその利⽤」. 北尾他編
『コンピュータ利⽤の外国語教育:CAIの動向と実践』(pp. 12-23). 東京:英知社


Sugiura, M., & Ozeki, S. (1994). Introduction to HyperCard and Composition: HyperComp. In D. Kluge, J. Lundelius, S. McGuire, K. Nozawa, S. Ozeki, M. Sugiura, & M. Taylor (Eds.), Proceedings of the National Conference on Computers and Composition 1993.




Burstein, J., & Wolska, M. (2003). Toward evaluation of writing style: finding overly repetitious word use in student writing. Proceedings of the 10th Conference of the European Chapter of the Association for Computational Linguistics, Budapest, Hungary, 35–42.
Enright, M. K., & Quinlan, T. (2010). Complementing human judgment of essays written by English language learners with e-rater® scoring. Language Testing, 27(3), 317-334.
石井雄隆・近藤悠介. (2015). 「文書分類の手法と一般化線形モデルを用いた英語ライティングにおける文法的誤りの影響」『じんもんこん2015論文集』. 71-76.

石井雄隆・近藤悠介 (2014).「英語学習者を対象とした自動採点システム―課題と展望―」『外国語教育メディア学会(LET)関西支部メソドロジー研究部会2013年度報告論集』1-11.
石岡恒憲・亀田雅之 (2003b). 「コンピュータによる小論文の自動採点システムJessの試作」『計算機統計学』16(1),3-18.
Kondo, Y., & Ishii, Y. (2014). Bridging the Gap Between Second Language Acquisition Research and the Development of Automated Scoring System for Second Language Speech. In R. C-H. Tsai. & R. Guy (Eds.), Language, Culture, and Information Technology (pp. 149-164). Taipei, Taiwan: Bookman Books.

Xi, X., Higgins, D., Zechner, K., & Williamson, D. M. (2008). Automated scoring of spontaneous speech using SpeechRaterSM v1. 0. ETS Research Report Series, 2008(2), i-102.




石井雄隆・ゴードンアダム・平賀純・永間広宣・大浦弘樹・森田裕介 (2016).「グローバルMOOCにおける相互評価の信頼性に関する検討-早稲田大学における事例から-」『日本教育工学会研究報告集』 JSET16-3, 155-160.


永田裕太郎・村上正行・森村吉貴・椋木雅之・美濃導彦 (2015).「MOOCにおける大規模学習履歴データからの受講者の学習様態獲得」『人工知能学会先進的学習科学と工学研究会(第73回)』25-30.


重田勝介(2016)「オープンエデュケーション開かれた教育が変える高等教育と生涯学習」『情報管理』59(1), 3-10.

渡邉文枝・向後千春(2015)「JMOOCの講座における受講生のeラーニング指向性と相互評価指向性が学習継続意欲と講座評価に及ぼす影響」『日本教育工学会研究報告集』JSET15-4, 87-94.


渡邉文枝・森裕樹・向後千春(2015)「JMOOCの講座における相互評価に対する受講者アンケートの分析」『人間科学研究』28(2), 237-245.




Cope, B., & Kalantzis, M. (2016). Big Data Comes to School: Implications for Learning, Assessment, and Research. AERA Open, 2(2), 1-19.




Saupe, J. L. (1990) The functions of institutional research. The Association for Institutional Research.


高橋哲也・星野聡孝・溝上慎一(2014)「学生調査とeポートフォリオならびに成績情報の分析について―大阪府立大学の教学IRの実践から―」『京都大学高等教育研究』 20, 1-15.

Cognitive Diagnosis Assessmentに関する簡単なまとめ

2007年と2013年のLTRCのシンポジウム、またそれらが基になり2009年のLanguage Assessment Quarterlyと2015年のLanguage TestingでCognitive DiagnosisやDiagnostic TestingがSpecial Issueとして取り上げられた。


Special Issue: Cognitive Diagnosis and Q-Matrices in Language Assessment


Special Issue on Future of Diagnostic Language Testing




Kim, Y. H. (2011). Diagnosing EAP writing ability using the reduced reparameterized unified model. Language Testing.


またDiagnostic language assessmentをどのように理論化するかを検討するために、医学・心理学・教育学などの各専門家にdiagnosisの定義・手段・手順などを半構造化インタビューした論文なども出ている。


Alderson, J. C., Brunfaut, T., & Harding, L. (2014). Towards a theory of diagnosis in second and foreign language assessment: Insights from professional practice across diverse fields. Applied Linguistics


日本人研究者を例にとれば、Tatsuoka (1983)などの先駆的取組が存在したけれど、言語テストで「診断」という観点にあまり焦点が当たってこなかったことは不思議だなと思っている。「言語能力」「測定」「評価」という観点に研究者の関心が集中しやすいことが遠因なのかもしれないけれど。