受験動機
公開テストを受験する動機は人によって違うでしょう。ボクの受験動機は、たぶん5つくらいあります。そのうち1つは「項目別正答率」に関する調査をすることです。
いろいろ調査をすることで、自分が正しいと思っていることが正しいと確認できたり、正しいと思っていたことが間違っていることを確認できたりするので、調査目的で受験するのはかなり楽しい活動です。
受験申込をする際に、そして、試験日にもアンケートに答える必要があります。「受験動機」としてリスト化されているものの中には、ボクの受験動機は1つもありません。「調査」とか「全国制覇」という選択肢がないため、仕方なく「自己啓発」を選んでいます。
第192回のTOEIC公開テストは2014年7月25日に実施され、ボクは鹿児島市で受験しました。これまでに、30都道府県で受験しました。
受験した場所:
いろいろ調査をすることで、自分が正しいと思っていることが正しいと確認できたり、正しいと思っていたことが間違っていることを確認できたりするので、調査目的で受験するのはかなり楽しい活動です。
受験申込をする際に、そして、試験日にもアンケートに答える必要があります。「受験動機」としてリスト化されているものの中には、ボクの受験動機は1つもありません。「調査」とか「全国制覇」という選択肢がないため、仕方なく「自己啓発」を選んでいます。
第192回のTOEIC公開テストは2014年7月25日に実施され、ボクは鹿児島市で受験しました。これまでに、30都道府県で受験しました。
受験した場所:
札幌、青森、秋田、仙台、郡山、宇都宮、前橋、富山、つくば、千葉、埼玉、東京、神奈川、山梨、静岡、長野、愛知、岐阜、滋賀、京都、大阪、神戸、岡山、広島、愛媛、山口、福岡、長崎、鹿児島、沖縄(30都道府県)
疑問86 600点取得が意味すること
大学や企業で「推奨」されたり「強制」されたりするTOEICのスコアは、500点か600点が多いようです。500点は公開テストの平均点より下ですが、IPテストの平均よりは上です。600点は公開テストの平均点より上です。
ですので、600点は「多くの人より英語ができる」レベルだと言えるかも知れません。別の言葉で言えば、どれくらいのレベルなのでしょうか。
600点をもたらす正答数は、各セクションで62問から64問です。
第188回の公開テストでは63問ずつで合計600点だったと言えそうです。
これは、48問を勘で解答しても達成できます。自信を持って解答し、正答する数が52問だとします。48問を勘で解答した場合、すべてが不正解になる可能性は非常に低いです。TOEICはマーク式テストですから。48問のうち少なく見積もっても12問は正解となるでしょう。選択肢を1つでも消去できれば、もっと正答数は増えます。
その12問と52問を足すと64問になります。それで600点を超えます。自信のある解答が52問ではなく、50問だとしても600点には達しそうです。
ということは、ある人が実際に600点を取った場合、自信を持って解答した数は全体の半分しかないという推測は高い確率で正しいと言えるでしょう。
ですので、600点は「多くの人より英語ができる」レベルだと言えるかも知れません。別の言葉で言えば、どれくらいのレベルなのでしょうか。
600点をもたらす正答数は、各セクションで62問から64問です。
第188回の公開テストでは63問ずつで合計600点だったと言えそうです。
これは、48問を勘で解答しても達成できます。自信を持って解答し、正答する数が52問だとします。48問を勘で解答した場合、すべてが不正解になる可能性は非常に低いです。TOEICはマーク式テストですから。48問のうち少なく見積もっても12問は正解となるでしょう。選択肢を1つでも消去できれば、もっと正答数は増えます。
その12問と52問を足すと64問になります。それで600点を超えます。自信のある解答が52問ではなく、50問だとしても600点には達しそうです。
ということは、ある人が実際に600点を取った場合、自信を持って解答した数は全体の半分しかないという推測は高い確率で正しいと言えるでしょう。
疑問84 存在しないスコアが存在することを証明する
第180回公開テストで行った実験の結果を発表します。メールマガジンで発表した通り、リスニングセクションで3問、リーディングセクションで2問を正答したつもりです。
リスニングセクションに注目すると、正答数が3で5点です。ということは、正答数が0でも1でも2でも3でも5点です。
1つのセクションにつき、正答数は101種類あります。スコアは最大で99種類しかありません。ですから、正答数が違っていてもスコアが同じになるケースは存在するはずです。実際、正答数が0から3であれば5点でした。それだけでなく、「存在しないスコア」が存在します。
このテストにおける正答数が4なら10点だとします。そして、正答数が1つ増えるごとにスコアが5ずつ上がっていくと仮定します。すると、100問正答すると490点になり、495点は存在しないはずです。
でも、実際は495点は存在しました。ということは、その仮定は間違っていると断定できます。さらに、現実的には正答数が100でなくても495点は出たはずです。仮に正答数97で495点、正答数96で490だとすると、4種類のスコアが欠けることになります。経験から言えば、これらの仮定は非現実的ではありません。
ただし、これは1つのフォームに関する話です。実際には別のフォームが見事に「穴」を埋めているのかも知れませんが、存在しないスコアが存在するだろうと言えそうな気がします。その理由は省略しますが、エクセルを使ってシミュレーションすれば、気づくでしょう。
リスニングセクションに注目すると、正答数が3で5点です。ということは、正答数が0でも1でも2でも3でも5点です。
1つのセクションにつき、正答数は101種類あります。スコアは最大で99種類しかありません。ですから、正答数が違っていてもスコアが同じになるケースは存在するはずです。実際、正答数が0から3であれば5点でした。それだけでなく、「存在しないスコア」が存在します。
このテストにおける正答数が4なら10点だとします。そして、正答数が1つ増えるごとにスコアが5ずつ上がっていくと仮定します。すると、100問正答すると490点になり、495点は存在しないはずです。
でも、実際は495点は存在しました。ということは、その仮定は間違っていると断定できます。さらに、現実的には正答数が100でなくても495点は出たはずです。仮に正答数97で495点、正答数96で490だとすると、4種類のスコアが欠けることになります。経験から言えば、これらの仮定は非現実的ではありません。
ただし、これは1つのフォームに関する話です。実際には別のフォームが見事に「穴」を埋めているのかも知れませんが、存在しないスコアが存在するだろうと言えそうな気がします。その理由は省略しますが、エクセルを使ってシミュレーションすれば、気づくでしょう。
疑問81 リスニングセクション200点の時の正答数
企業研修や大学でセミナーをすると、リスニングセクションが200点前後の方に出会うことが多いです。正答数が60問なら250点前後になることは、かつて複数回の実験により証明していました。
第156回と第157回の公開テストでは、200点をターゲットにして同じ実験をしました。正答数は、リスニングセクションで45問です。リーディングセクションでは、何となくシングルパッセージだけを狙って28問を正答しました。
結果はこうなりました。
正答数45問が200点をもたらすことが証明されたと言ってもいいでしょう。実際にリスニングセクションで200点前後を取得した場合は、正答数が45前後だったということです。教える仕事をしている方は、受講者のスコアを見る機会があると思います。リスニングセクションが200点なら「だいたい45問を正解できていたね」と即答して構いません。
45問を正答した。
この事実は「自信を持って正答した数は100問のうち30問くらいだった」ことを示しています。なぜなら、70問を完全に勘に頼って解答しても、おそらく15問から20問くらいは正答できるからです。30問のうち、ほとんどはパート1とパート2のアイテムでしょう。後半のパート3とパート4は前半に比べて難易度が高いですから。会話やトークは、雑音の津波状態です、きっと。であれば、教える人は、授業で受講者の方に「できる」という感覚を持っていただくには、パート1とパート2に時間を多く割り当てることが「指導者としてのストラテジー」になるでしょう。
第156回と第157回の公開テストでは、200点をターゲットにして同じ実験をしました。正答数は、リスニングセクションで45問です。リーディングセクションでは、何となくシングルパッセージだけを狙って28問を正答しました。
結果はこうなりました。
正答数45問が200点をもたらすことが証明されたと言ってもいいでしょう。実際にリスニングセクションで200点前後を取得した場合は、正答数が45前後だったということです。教える仕事をしている方は、受講者のスコアを見る機会があると思います。リスニングセクションが200点なら「だいたい45問を正解できていたね」と即答して構いません。
45問を正答した。
この事実は「自信を持って正答した数は100問のうち30問くらいだった」ことを示しています。なぜなら、70問を完全に勘に頼って解答しても、おそらく15問から20問くらいは正答できるからです。30問のうち、ほとんどはパート1とパート2のアイテムでしょう。後半のパート3とパート4は前半に比べて難易度が高いですから。会話やトークは、雑音の津波状態です、きっと。であれば、教える人は、授業で受講者の方に「できる」という感覚を持っていただくには、パート1とパート2に時間を多く割り当てることが「指導者としてのストラテジー」になるでしょう。
疑問74 低い英語力が高いスコアを招く理由
TOEICは基本的には英語力を測定し、それを合計スコア10から990で示します。よって、英語力が高ければ高いほど、スコアは990に近くなると言えます。
ところが、英語力が低ければ低いほどスコアが10に近くなるとは言えません。むしろ、一定のレンジにおいては「英語力が低い方がスコアは高くなる」のです。
第150回の公開テスト(2009年10月)では、ボクのスコアはこうなりました。
リスニング:110
リーディング:85
これは「英語力がゼロ」の状態で受験しても取得できるスコアです。なぜなら、ボクはすべての問題を「適当に」解答したからです。ざっくり200を基準値だとすると次の2つを導くことが可能です。
・ゾーン1
スコア 200 <-----------------------> 990
英語力 低 <-----------------------> 高
・ゾーン2
スコア 10 <-----------> 200
英語力 高 <-----------> 低
例えば、スコアが100の人と200の人を比べると、前者は後者より英語力が高いことが推測できます。その理由はアイテムライティング(問題作成)の原則に関係しています。
大まかに言えば、問題作成者は不正解の選択肢を「誰かが選びたくなるように」作ります。「誰か」というのは、そのアイテムを正解するための十分な英語力がない人です。ただし、選択肢は英語で書かれるので「選択肢をまったく理解できない人」のことは想定しません。「選択肢をある程度は理解できるが、十分には理解できない人が選びたくなるような不正解」を作るのです。
パート2を例にしましょう。
Is this your jacket? という質問を作ったとします。
(A) Where did you find it?
(B) No. I saw your jacket over there.
積極的に(B)を選ぶ受験者は必ずいます。問題作成者が、質問と選択肢を少しは理解できた人を想定しているということです。しかしながら、質問も選択肢もまったく理解できない人は、まったく理解していないがために、(B)を含めて、どの選択肢も積極的に選ぶことはできず、適当に選ぶしかありません。適当に200問を解答したら「基準値」である200点を取ります。
積極的に不正解を選べる人と、すべて適当に解答するしかない人を比べると、前者の方が英語力が高いと言えるはずです。ところが、スコアは正答数をベースに算出されますので、前者のスコアは後者と比べると低くなります。
麻雀をするたびに「振り込み」まくって負ける人がいます。懸命に考えてから牌を捨てている人もいるでしょう。選んではいけないものを選び捨ててしまう。振り込む。負ける。冷静に考えれば「相手が欲しい牌」を選ぶのが上手いわけです。であれば、選んだ後で「捨てる」決断さえしなければ振り込み率は下がるはずです。実力を高めるつもりがなく、振り込み率を下げたいならば、自分の決断に従わないことがその方法です。TOEICに当てはめると、全力を出して200点を取ることができないならば、「しっかり考えたうえで自分が正解だと思った選択肢をマークしない」ことでスコアを上げることができます。そんなことが必要な受験者は少ないでしょうが。
ところが、英語力が低ければ低いほどスコアが10に近くなるとは言えません。むしろ、一定のレンジにおいては「英語力が低い方がスコアは高くなる」のです。
第150回の公開テスト(2009年10月)では、ボクのスコアはこうなりました。
リスニング:110
リーディング:85
これは「英語力がゼロ」の状態で受験しても取得できるスコアです。なぜなら、ボクはすべての問題を「適当に」解答したからです。ざっくり200を基準値だとすると次の2つを導くことが可能です。
・ゾーン1
スコア 200 <-----------------------> 990
英語力 低 <-----------------------> 高
・ゾーン2
スコア 10 <-----------> 200
英語力 高 <-----------> 低
例えば、スコアが100の人と200の人を比べると、前者は後者より英語力が高いことが推測できます。その理由はアイテムライティング(問題作成)の原則に関係しています。
大まかに言えば、問題作成者は不正解の選択肢を「誰かが選びたくなるように」作ります。「誰か」というのは、そのアイテムを正解するための十分な英語力がない人です。ただし、選択肢は英語で書かれるので「選択肢をまったく理解できない人」のことは想定しません。「選択肢をある程度は理解できるが、十分には理解できない人が選びたくなるような不正解」を作るのです。
パート2を例にしましょう。
Is this your jacket? という質問を作ったとします。
(A) Where did you find it?
(B) No. I saw your jacket over there.
積極的に(B)を選ぶ受験者は必ずいます。問題作成者が、質問と選択肢を少しは理解できた人を想定しているということです。しかしながら、質問も選択肢もまったく理解できない人は、まったく理解していないがために、(B)を含めて、どの選択肢も積極的に選ぶことはできず、適当に選ぶしかありません。適当に200問を解答したら「基準値」である200点を取ります。
積極的に不正解を選べる人と、すべて適当に解答するしかない人を比べると、前者の方が英語力が高いと言えるはずです。ところが、スコアは正答数をベースに算出されますので、前者のスコアは後者と比べると低くなります。
麻雀をするたびに「振り込み」まくって負ける人がいます。懸命に考えてから牌を捨てている人もいるでしょう。選んではいけないものを選び捨ててしまう。振り込む。負ける。冷静に考えれば「相手が欲しい牌」を選ぶのが上手いわけです。であれば、選んだ後で「捨てる」決断さえしなければ振り込み率は下がるはずです。実力を高めるつもりがなく、振り込み率を下げたいならば、自分の決断に従わないことがその方法です。TOEICに当てはめると、全力を出して200点を取ることができないならば、「しっかり考えたうえで自分が正解だと思った選択肢をマークしない」ことでスコアを上げることができます。そんなことが必要な受験者は少ないでしょうが。
疑問72 測定されない力
990を取得したことがある人が、初めてそれを取得したときに気づくことがあります。それは、TOEICが測定していない能力が多くあることです。まず、話す力や書く力が(望むほどは)高くないという事実に気づくものです。そして、努力を継続しようという気持ちが高まるきっかけが、990取得である人もいるでしょう。
そして、2年の月日が流れ去り、街でルビーのリングを見かけると、いえ、知人のAさんが990を8回も9回も取得していることに気づきます。自分は1回だけ。スコアを見ると10点くらいしか違いません。親友Bさんと悪友Cさんは「へぇ、お前らすげぇな」と言ってノホホンとしていますが、自分自身は「何かが違う」と感じ始めます。
「Aと俺は何が違うんだ」
簡単なことです。
TOEICが測定していないのは、話したり書いたりする力だけではありません。単純に言って「TOEICにおいて995以上のスコアを取れる力」が測定されていないのです。
何回も990を取ることができるAさんは、1150や1200を取る力を備えているのだと思います。たまに980を取ることがあったとしても。たまたま利用しているのがTOEICというテストなので、戦闘力が正しく測定されていないのです。スカウター(*)を使って測定したとして、戦闘力1200の人ならTOEICで990を年に5回ほど取得するでしょう。戦闘力が1450あれば常に990を取るかも知れません。
かつて日本には、PRIDEというリングがありました。そして、もっと前からアメリカにあったUFCというリングから強い選手が流れ込んできました。なぜ、わざわざアメリカから日本に来たのか。それは「新しいテスト」を受けるためでしょう。UFCという土俵の中で強いことが証明されても「俺はもっと強い」と思った選手が「どうやら海の向こうには、俺の戦闘力を正しく測定するテストがあるらしい」と思って参戦したわけです。そして、確かにPRIDEのリングには人類最強のヒョードルをはじめとする、戦闘力が8000(推定)を超える選手がいたのです。「最強」の称号を得るにはPRIDEに来るのが正しい選択だったわけです。その後、PRIDEというテスト自体が消滅したため、おそらくUFCが世界最高峰のテストになっています。すると今度はUFCに参戦する強い選手が増えています。
TOEICは、それなりによくできたテストですが、995以上の力の差を示すことを意図していません。戦闘力が1200の人も、ギリギリ990の人も、1回分のスコアを見れば結果は同じ990かも知れません。「ある時点のスコアだけ」を比べても優劣は判断できません。
将棋の世界における「最強」の称号は名人位です。「神武以来の天才」と呼ばれた加藤一二三氏や、別の意味ですごい米長邦雄氏は名人位を得ましたが1期しか保持できませんでした。大山康晴氏、中原誠氏、羽生善治氏の成績を見れば、実力が違うことは明らかでしょう。
完全な推測ですが、年8回TOEICを受験して990を5回も6回も取得する人と、1回だけ取得する人の間には大きな力の差があると思います。戦闘力1200と990(ともに推定)くらいの差があるでしょう。ですから「両者の実力は同じ」と言える勇気も根拠もありません。それに、何らかの理由で990を取りたいと思っている人の心情を察すれば「実力は同じだよ」という言葉は何の役にも立ちません。励ましにもなりません。ボク自身、990を取るつもりで2004年11月から2005年10月まで8回連続失敗していましたので、少しはその心情を理解できるつもりです。もし、何らかの言葉をかけなくてはならないならば、1つしか思いつきません。
「努力が足りねーんだよ。もっと勉強しやがれ」
戦闘力が990程度だと、990を1回取っても加藤一二三氏や米長邦雄氏と同じです(両名とも尋常ではないレベルですが)。すぐに陥落するつもりならそれで構いませんが安定的に990を取れるようになりたいなら、少なく見積もっても1150程度の戦闘力を持つべきでしょう。TOEICで1150を取るくらい、さまざまなことを学び、余裕で990を取る。それくらいの気持ちで勉強していただきたいです。
K-1王者になったレミーボンヤスキーや数多くのボクシング王者の言葉を借りるまでもなく「王座の防衛は奪取より難しい」のです。あの辰吉丈一郎は試合の翌日から練習をしていたそうです。その理由を聞かれ「練習しないと力が落ちそうで不安だから」と答えたことがあったそうです。天才は不安を感じないはずですが、自分が天才であると信じている人など、きっと世にいないでしょう。だから練習するのです。英語学習にそのまま当てはめる必要も必然性もないとは思いますが、実力の高い人々は意識的に、または無意識のうちに学び続けているものです。
第149回公開テストでは久しぶりに200問分のマークを塗りました。
ボクが990を取得するのは2回目です。2005年11月以降、990というスコアを自分で取ることに関心を失い、別の目的で受験を続けてきました。今回のテストで990を取ったのは「気まぐれ」です。次に取る日は来ません。自分が990を取ることより、自分が教えた相手が990を取ることの方が、よほどうれしく感じます。指導者養成講座をはじめとするボクのセミナーの参加者の中で、毎年どなたかが990を(はじめて)取得しており、そのニュースを聞くと非常にうれしく感じます。たとえ一時的だとしても、その人自身が本当に喜んでいることが分かるからです。
ボク自身の戦闘力は、しょせん1000程度だと思います。たくさんの人に追い抜かれることを祈りつつ、自分も学び続けていこう、と、このスコアを見て思いました。測定されない力を伸ばしながら。
そして、2年の月日が流れ去り、街でルビーのリングを見かけると、いえ、知人のAさんが990を8回も9回も取得していることに気づきます。自分は1回だけ。スコアを見ると10点くらいしか違いません。親友Bさんと悪友Cさんは「へぇ、お前らすげぇな」と言ってノホホンとしていますが、自分自身は「何かが違う」と感じ始めます。
「Aと俺は何が違うんだ」
簡単なことです。
TOEICが測定していないのは、話したり書いたりする力だけではありません。単純に言って「TOEICにおいて995以上のスコアを取れる力」が測定されていないのです。
何回も990を取ることができるAさんは、1150や1200を取る力を備えているのだと思います。たまに980を取ることがあったとしても。たまたま利用しているのがTOEICというテストなので、戦闘力が正しく測定されていないのです。スカウター(*)を使って測定したとして、戦闘力1200の人ならTOEICで990を年に5回ほど取得するでしょう。戦闘力が1450あれば常に990を取るかも知れません。
スカウター(*)
通信機能と生命体探索機能を兼ね備えた装置で、モノクル(片眼鏡)に似た形をしている。片耳に取り付け、付属する半透明の小型スクリーンに、生命体の戦闘能力を数値化した情報や、その対象への方角や距離が表示される。
(引用元:フリー百科事典『ウィキペディア(Wikipedia)』
かつて日本には、PRIDEというリングがありました。そして、もっと前からアメリカにあったUFCというリングから強い選手が流れ込んできました。なぜ、わざわざアメリカから日本に来たのか。それは「新しいテスト」を受けるためでしょう。UFCという土俵の中で強いことが証明されても「俺はもっと強い」と思った選手が「どうやら海の向こうには、俺の戦闘力を正しく測定するテストがあるらしい」と思って参戦したわけです。そして、確かにPRIDEのリングには人類最強のヒョードルをはじめとする、戦闘力が8000(推定)を超える選手がいたのです。「最強」の称号を得るにはPRIDEに来るのが正しい選択だったわけです。その後、PRIDEというテスト自体が消滅したため、おそらくUFCが世界最高峰のテストになっています。すると今度はUFCに参戦する強い選手が増えています。
TOEICは、それなりによくできたテストですが、995以上の力の差を示すことを意図していません。戦闘力が1200の人も、ギリギリ990の人も、1回分のスコアを見れば結果は同じ990かも知れません。「ある時点のスコアだけ」を比べても優劣は判断できません。
将棋の世界における「最強」の称号は名人位です。「神武以来の天才」と呼ばれた加藤一二三氏や、別の意味ですごい米長邦雄氏は名人位を得ましたが1期しか保持できませんでした。大山康晴氏、中原誠氏、羽生善治氏の成績を見れば、実力が違うことは明らかでしょう。
完全な推測ですが、年8回TOEICを受験して990を5回も6回も取得する人と、1回だけ取得する人の間には大きな力の差があると思います。戦闘力1200と990(ともに推定)くらいの差があるでしょう。ですから「両者の実力は同じ」と言える勇気も根拠もありません。それに、何らかの理由で990を取りたいと思っている人の心情を察すれば「実力は同じだよ」という言葉は何の役にも立ちません。励ましにもなりません。ボク自身、990を取るつもりで2004年11月から2005年10月まで8回連続失敗していましたので、少しはその心情を理解できるつもりです。もし、何らかの言葉をかけなくてはならないならば、1つしか思いつきません。
「努力が足りねーんだよ。もっと勉強しやがれ」
戦闘力が990程度だと、990を1回取っても加藤一二三氏や米長邦雄氏と同じです(両名とも尋常ではないレベルですが)。すぐに陥落するつもりならそれで構いませんが安定的に990を取れるようになりたいなら、少なく見積もっても1150程度の戦闘力を持つべきでしょう。TOEICで1150を取るくらい、さまざまなことを学び、余裕で990を取る。それくらいの気持ちで勉強していただきたいです。
K-1王者になったレミーボンヤスキーや数多くのボクシング王者の言葉を借りるまでもなく「王座の防衛は奪取より難しい」のです。あの辰吉丈一郎は試合の翌日から練習をしていたそうです。その理由を聞かれ「練習しないと力が落ちそうで不安だから」と答えたことがあったそうです。天才は不安を感じないはずですが、自分が天才であると信じている人など、きっと世にいないでしょう。だから練習するのです。英語学習にそのまま当てはめる必要も必然性もないとは思いますが、実力の高い人々は意識的に、または無意識のうちに学び続けているものです。
第149回公開テストでは久しぶりに200問分のマークを塗りました。
ボクが990を取得するのは2回目です。2005年11月以降、990というスコアを自分で取ることに関心を失い、別の目的で受験を続けてきました。今回のテストで990を取ったのは「気まぐれ」です。次に取る日は来ません。自分が990を取ることより、自分が教えた相手が990を取ることの方が、よほどうれしく感じます。指導者養成講座をはじめとするボクのセミナーの参加者の中で、毎年どなたかが990を(はじめて)取得しており、そのニュースを聞くと非常にうれしく感じます。たとえ一時的だとしても、その人自身が本当に喜んでいることが分かるからです。
ボク自身の戦闘力は、しょせん1000程度だと思います。たくさんの人に追い抜かれることを祈りつつ、自分も学び続けていこう、と、このスコアを見て思いました。測定されない力を伸ばしながら。
疑問68 470点を取るために必要な正答数
合計スコアで470点を取るためには各セクションで57パーセントが必要である、という仮説は何回か検証したことがあります。2009月1月11日に実施された、第144回の公開テストでは、ロバート・ヒルキ氏と一緒に実験しました。正答数は次の通りです。
ロバートの正答数:56問ずつ(各セクション)
ロバートが470をターゲットにした理由は、企業で教える機会が多いからです。企業が社員に470を課す事情は知りませんが。もともとは、57パーセントが必要であると2人とも知っていたのですが、テスト前にケンタッキーフライドキチンで打ち合わせした際に、何となく56を選びました。
実際のスコア
リスニング:245 リーディング:215 合計:460
このような検証は過去に何回もやってきたので自信はありましたが、実際に460になったので、57パーセントで470になるであろう、という証明はできたと言えそうです。もちろん、テストによって多少の誤差は出ますが。
ボクは同じテストで各セクション52問ずつを正答し、スコアは次の通りです。
リスニング:230 リーディング:205 合計:435
2人の差を比べると1問の価値が推測できます。
だいたい、以下の数値が正しいと言えるでしょう。正答数とスコアの関係です。
正答数、リスニング、リーディングの順で。
56 245 215
55 245 210
54 240 210
53 235 205
52 230 205
51 225 200
リーディングでは、4問の差が10点の差しか生み出していません。その近辺に受験者が多く存在するからです。TOEICのスコアは正答数に一定の数値を掛けることで算出できるものではありません。多くの人が存在する領域では「1問の価値」が低いです。ですから、同じ1問の差でも、領域しだいでは4問の差が30点くらいの差を生むこともあります。過去の実験によれば。
検証すれば簡単に判明しますが、なぜか、多くの「プロらしき人」は検証しません。もちろん受験者も。だから、間違った情報が本に載っていても、講師が適当な情報を言っても顧客は気づきません。不思議な市場です。
ロバートの正答数:56問ずつ(各セクション)
ロバートが470をターゲットにした理由は、企業で教える機会が多いからです。企業が社員に470を課す事情は知りませんが。もともとは、57パーセントが必要であると2人とも知っていたのですが、テスト前にケンタッキーフライドキチンで打ち合わせした際に、何となく56を選びました。
実際のスコア
リスニング:245 リーディング:215 合計:460
このような検証は過去に何回もやってきたので自信はありましたが、実際に460になったので、57パーセントで470になるであろう、という証明はできたと言えそうです。もちろん、テストによって多少の誤差は出ますが。
ボクは同じテストで各セクション52問ずつを正答し、スコアは次の通りです。
リスニング:230 リーディング:205 合計:435
2人の差を比べると1問の価値が推測できます。
だいたい、以下の数値が正しいと言えるでしょう。正答数とスコアの関係です。
正答数、リスニング、リーディングの順で。
56 245 215
55 245 210
54 240 210
53 235 205
52 230 205
51 225 200
リーディングでは、4問の差が10点の差しか生み出していません。その近辺に受験者が多く存在するからです。TOEICのスコアは正答数に一定の数値を掛けることで算出できるものではありません。多くの人が存在する領域では「1問の価値」が低いです。ですから、同じ1問の差でも、領域しだいでは4問の差が30点くらいの差を生むこともあります。過去の実験によれば。
検証すれば簡単に判明しますが、なぜか、多くの「プロらしき人」は検証しません。もちろん受験者も。だから、間違った情報が本に載っていても、講師が適当な情報を言っても顧客は気づきません。不思議な市場です。
疑問64 1問の価値を再検討
解決しにくい疑問が発生しています。
同一のテストの同一セクションにおいて、あるアイテムと別のアイテムの価値、つまりスコアへの貢献度は同じであるはずです。つまり、同じテストのリーディングセクションでAさんが76問正答し、Bさんが76問正答したのであれば、パートに関係なくスコアは同じです。なぜなら、TOEICの主催者は「正答数」によってスコアが決まることを発表していますし、ボクの過去の実験からも、それを証明できたからです。
ところが、2008年7月実施の、第140回の公開テストで異変が起きました。
以下、項目別正答率(Abilities Maesured)をAMと表記します。
ボクが取得したリーディングのAMを掲載します。
94
100
96
100
100
スコアは475です。
HUMMERさんのリーディングのAMです。
94
100
96
100
100
スコアは485です。これが証拠画像です。
HUMMERさんが受験したのは、ボクと同じフォームです。
AMが同じ(正答数が同じ)ですがスコアが違う、という現象が起きました。
正答数が異なる可能性はありません。
項目別に割り当てられたアイテム数は25問くらいですから、正答数が1つでも違えばAMにおけるパーセントも確実に異なります。スコアが間違っているとも思えません。
よって、正答したアイテムの1問あたりの価値が違うとしか考えられません。ただし、それに反する証拠はあるものの、サポートする証拠は今回の結果だけです。
理由は知りませんが、第140回のテストでは1問あたりの価値が異なる可能性が高いとは言えそうです。
HUMMERさんとボクの正答数は98です。さらに異なるデータを見てみます。
97問を正答した、morite2さんのリーディングのAMです。
100
100
96
96
96
スコアは465です。これが証拠画像です。
100問を正答した、神崎正哉さんのリーディングのAMです。
100
100
100
100
100
スコアは495です。これが証拠画像です。
全員、受験したテストフォームは同じです(4EIC15)。並べてみます。
正答数100 495 :神崎さん
正答数98 485 :HUMMERさん
正答数98 475 :前田
正答数97 465 :morite2さん
470と480に該当する正答数がありません。
ただし、異なるフォームでは、ある人物の正答数が98でスコアが480でした。
正答数100 495 :神崎さん
正答数98 485 :HUMMERさん
正答数98 480 :ある人物さん → フォームが異なる(4EIC16)
正答数98 475 :前田
正答数97 465 :morite2さん
正答数99というサンプルがありませんが、それは485か、490か、495のどれかでしょう。どれ、とは言えません。100問しかないので、異なる正答数でもスコアが同じになる可能性はあるからです。
HUMMERさんとmorite2さんを比べると20も違います。1問の差で。
それより、HUMMERさんとボクの差が10あるのが不思議です。
満点に近ければ、正答数は正確に算出できます。
460以上だった方からのサンプル提供を希望します。よろしければ、フォーム番号と一緒にコメント欄に記入してください(フォーム番号がなければサンプルとして使えません)。以下は記入例です。
フォーム:4EIC15または4EIC16
100
100
96
96
96
スコア:465
状況が変化したら記事を更新します。
この「疑問」は解決されないかも知れませんが・・・。
追記
追記2
同一のテストの同一セクションにおいて、あるアイテムと別のアイテムの価値、つまりスコアへの貢献度は同じであるはずです。つまり、同じテストのリーディングセクションでAさんが76問正答し、Bさんが76問正答したのであれば、パートに関係なくスコアは同じです。なぜなら、TOEICの主催者は「正答数」によってスコアが決まることを発表していますし、ボクの過去の実験からも、それを証明できたからです。
ところが、2008年7月実施の、第140回の公開テストで異変が起きました。
以下、項目別正答率(Abilities Maesured)をAMと表記します。
ボクが取得したリーディングのAMを掲載します。
94
100
96
100
100
スコアは475です。
HUMMERさんのリーディングのAMです。
94
100
96
100
100
スコアは485です。これが証拠画像です。
HUMMERさんが受験したのは、ボクと同じフォームです。
AMが同じ(正答数が同じ)ですがスコアが違う、という現象が起きました。
正答数が異なる可能性はありません。
項目別に割り当てられたアイテム数は25問くらいですから、正答数が1つでも違えばAMにおけるパーセントも確実に異なります。スコアが間違っているとも思えません。
よって、正答したアイテムの1問あたりの価値が違うとしか考えられません。ただし、それに反する証拠はあるものの、サポートする証拠は今回の結果だけです。
理由は知りませんが、第140回のテストでは1問あたりの価値が異なる可能性が高いとは言えそうです。
HUMMERさんとボクの正答数は98です。さらに異なるデータを見てみます。
97問を正答した、morite2さんのリーディングのAMです。
100
100
96
96
96
スコアは465です。これが証拠画像です。
100問を正答した、神崎正哉さんのリーディングのAMです。
100
100
100
100
100
スコアは495です。これが証拠画像です。
全員、受験したテストフォームは同じです(4EIC15)。並べてみます。
正答数100 495 :神崎さん
正答数98 485 :HUMMERさん
正答数98 475 :前田
正答数97 465 :morite2さん
470と480に該当する正答数がありません。
ただし、異なるフォームでは、ある人物の正答数が98でスコアが480でした。
正答数100 495 :神崎さん
正答数98 485 :HUMMERさん
正答数98 480 :ある人物さん → フォームが異なる(4EIC16)
正答数98 475 :前田
正答数97 465 :morite2さん
正答数99というサンプルがありませんが、それは485か、490か、495のどれかでしょう。どれ、とは言えません。100問しかないので、異なる正答数でもスコアが同じになる可能性はあるからです。
HUMMERさんとmorite2さんを比べると20も違います。1問の差で。
それより、HUMMERさんとボクの差が10あるのが不思議です。
満点に近ければ、正答数は正確に算出できます。
460以上だった方からのサンプル提供を希望します。よろしければ、フォーム番号と一緒にコメント欄に記入してください(フォーム番号がなければサンプルとして使えません)。以下は記入例です。
フォーム:4EIC15または4EIC16
100
100
96
96
96
スコア:465
状況が変化したら記事を更新します。
この「疑問」は解決されないかも知れませんが・・・。
追記
早くも解決しそうです。ボク自身が知っていた、ある知識を失念していました。この記事の中に、謝った認識に基づいた記述があります。そのせいで、そこから派生している様々な推測が間違っています。
追記2
ボクが犯したミスは「AMが同じなら正答数が同じである」という判断です。以前の実験により、リーディングセクションのいくつかのアイテムは複数の「項目」に影響することを確認したのですが、今回はその事実を忘れていました。メールマガジンの読者の方から指摘を受けて思い出しました。ありがとうございました。
現段階で、最も正しいであろう推測結果をエクセルで作りました。
(クリックで拡大)
疑問59 異なるテストフォームでは項目別平均点も異なるのか
ある1回の公開テストには複数のフォーム(テスト問題)が使われます。
アイテム(問題)は9つの「項目」に分類されています。例えば「語彙が理解できる」など。スコアシートに掲載されている「項目別正答率」を見れば明らかです。
よって、異なるフォームでは正答率も異なります。
つまり、フォームAとフォームBにおける9つの項目を照合すれば、ある項目に関してAの正答率がBのそれより高い(または低い)ことがあります。
実際に、第137回(2008年3月)のテストで「語彙」の平均正答率をチェックしたら、片方が64パーセントで、もう片方は違う数値でした。受験者の平均的な能力が違っていたのかも知れませんが、それぞれを十分に多くの人が受験したはずですから、それが理由だと考えるよりは、テスト問題そのものの難易度が異なっていたと考えるほうが自然です。
第138回(2008年5月)の公開テストには少なくとも3つのフォームが使われていました。もしかすると項目によっては大きく差があるかも知れませんし、ないかも知れません。
あらゆる項目でフォームAの正答率がフォームBの正答率より高い(または低い)可能性もあります。その場合は、全体的に言えばフォームAはフォームBより「難しいテストである」と言えるでしょう。少なくともデータ上は。
よって、テストを受験した後で、Pさんが「いや〜、今日のテストは難しいね」と言ったとして、Pさんと同じ能力のQさんが「どっちかと言えば易しかったぞ」と言うかも知れません。「難しい」とか「易しい」は主観的なので単純な比較はできるはずがないものの、Pさんが受けたテストはQさんが受けたテストより本当に難しかった可能性もあるということです。
調査にご協力ください
リスニング:上から順に1234 リーディング:上から順に56789
これがフォーマットです。枠線内をコピーしてお使いください。
2008年6月16日の正午に、そのテストの結果がインターネットで発表されますが、項目別正答率は発表されません。
アイテム(問題)は9つの「項目」に分類されています。例えば「語彙が理解できる」など。スコアシートに掲載されている「項目別正答率」を見れば明らかです。
よって、異なるフォームでは正答率も異なります。
つまり、フォームAとフォームBにおける9つの項目を照合すれば、ある項目に関してAの正答率がBのそれより高い(または低い)ことがあります。
実際に、第137回(2008年3月)のテストで「語彙」の平均正答率をチェックしたら、片方が64パーセントで、もう片方は違う数値でした。受験者の平均的な能力が違っていたのかも知れませんが、それぞれを十分に多くの人が受験したはずですから、それが理由だと考えるよりは、テスト問題そのものの難易度が異なっていたと考えるほうが自然です。
第138回(2008年5月)の公開テストには少なくとも3つのフォームが使われていました。もしかすると項目によっては大きく差があるかも知れませんし、ないかも知れません。
あらゆる項目でフォームAの正答率がフォームBの正答率より高い(または低い)可能性もあります。その場合は、全体的に言えばフォームAはフォームBより「難しいテストである」と言えるでしょう。少なくともデータ上は。
よって、テストを受験した後で、Pさんが「いや〜、今日のテストは難しいね」と言ったとして、Pさんと同じ能力のQさんが「どっちかと言えば易しかったぞ」と言うかも知れません。「難しい」とか「易しい」は主観的なので単純な比較はできるはずがないものの、Pさんが受けたテストはQさんが受けたテストより本当に難しかった可能性もあるということです。
調査にご協力ください
第138回(2008年5月)の公開テストのスコアシートは、6月22日の日曜日には配達されるはずです。テストフォームの記号と項目別正答率(平均)をコメント欄に記入してくださる方がいれば、ぜひご記入ください。
テストフォームの記号は4EIC9か、4EIC10か、4EIC12のどれかのはずです。「項目」は書くのが面倒なので次のように省略します。
リスニング:上から順に1234 リーディング:上から順に56789
これがフォーマットです。枠線内をコピーしてお使いください。
フォーム:4EIC9 4EIC10 4EIC12 どれか1つ選択 例:4EIC10
正答率(平均) 半角数字を記入 例:65
1:
2:
3:
4:
5:
6:
7:
8:
9:
2008年6月16日の正午に、そのテストの結果がインターネットで発表されますが、項目別正答率は発表されません。
疑問55 全部(A)を塗るとスコアは
スコアは正答数に基づいて算出されます。
「どのアイテムを正解したか」は無関係。たまに「すべて同じ記号を塗ると結果はどうなるか」という、答えを知っても実行しない疑問を投げかける受験者がいます。
ボクは調査目的にリーディングセクションを25問だけ正解したことがあります。
スコアは70でした。リーディングセクションは、選択肢が4つずつですので、確率的には25問が正解になります。リスニングはPart 2が3択なので、27.5問が正解。
その調査をしたときは「正答数」が明確である必要があったので記号は適当に分散していました。200問を適当にマークした場合、合計スコアは180点から230点になることは分かっています。パーセンタイルランクはゼロか、それに近い数字。つまり、全力で取り組んで230点の場合は、英語能力ゼロとほぼ同じか「不正解」を見抜き、それを選ぶ能力が高いということです。
記号を(A)で統一する実験をする予定はありません。なぜなら・・・
やった人がいるからです。
自称「プチ変態」の常野雄次郎さんです。
第124回の公開テスト(2006年7月)で(A)だけ塗りました。
・リスニング:110
・リーディング:70
計180という結果で、パーセンタイルランクは両方0です。彼のブログに証拠画像があります。正答数は不明ですが、確率的にはリスニングの方が少し多いはず。
常野さんは、1977年生まれ。2000年1月<早い!>に990点を取得。
↑画像をクリックすると左に「ランキング」があり、21位にTOEICがあります。
生涯学習のユーキャンが、TOEIC講座を出すのはいいんですが、TOEICを「生涯学習」として扱っているのが興味深いです。資料請求してみたので、観察してみます。
「どのアイテムを正解したか」は無関係。たまに「すべて同じ記号を塗ると結果はどうなるか」という、答えを知っても実行しない疑問を投げかける受験者がいます。
ボクは調査目的にリーディングセクションを25問だけ正解したことがあります。
スコアは70でした。リーディングセクションは、選択肢が4つずつですので、確率的には25問が正解になります。リスニングはPart 2が3択なので、27.5問が正解。
その調査をしたときは「正答数」が明確である必要があったので記号は適当に分散していました。200問を適当にマークした場合、合計スコアは180点から230点になることは分かっています。パーセンタイルランクはゼロか、それに近い数字。つまり、全力で取り組んで230点の場合は、英語能力ゼロとほぼ同じか「不正解」を見抜き、それを選ぶ能力が高いということです。
記号を(A)で統一する実験をする予定はありません。なぜなら・・・
やった人がいるからです。
自称「プチ変態」の常野雄次郎さんです。
第124回の公開テスト(2006年7月)で(A)だけ塗りました。
・リスニング:110
・リーディング:70
計180という結果で、パーセンタイルランクは両方0です。彼のブログに証拠画像があります。正答数は不明ですが、確率的にはリスニングの方が少し多いはず。
常野さんは、1977年生まれ。2000年1月<早い!>に990点を取得。
エッセンスイングリッシュスクールで講師をしています。また、通信講座の大手「ユーキャン」から出ているTOEIC講座の主席執筆者でもあります。その講座を調べてみたら、(講座と関連するかどうか知りませんが)花田先生のセミナー動画が無料公開されていました。約40分もあります。
↑画像をクリックすると左に「ランキング」があり、21位にTOEICがあります。
生涯学習のユーキャンが、TOEIC講座を出すのはいいんですが、TOEICを「生涯学習」として扱っているのが興味深いです。資料請求してみたので、観察してみます。
⇒ 前田広之 (09/19)
⇒ やすべえ (09/19)
⇒ 塩見賢人 (10/28)
⇒ 青年海外協力隊 (02/19)
⇒ ken (08/25)
⇒ 前田 (08/25)
⇒ ken (08/25)
⇒ 前田 (06/15)
⇒ AKKO (06/14)
⇒ 前田 (05/11)