티스토리 뷰

통계: 숫자에 의해
통계를 본 적 있죠…
“10명 중 9명의 의사들이 X 브랜드를 추천합니다” “10명 중 7명이 Y 상표의 맛을 선호합니다” “보통 사람은 매년 평균 Z만큼의 수를 흔히 가집니다” 이 숫자들이 의미하는 바가 무엇일까요? 통계 때문에 오해하는 경우도 있을까요? “통계”라는 단어에는 실제 여러가지 의미가 있습니다. 우유를 좋아하는 사람의 수, 흰색 고양이의 비율과 같은 하나의 사실을 나타내는 것일 수 있습니다. 통계는 일정 수로 이루어진 집단을 기술하기 위해 사용됩니다. 일련의 숫자를 모으고, 분석하여 제시하기 위해 사용되는 각종 방법과 기술 또한 통계라 불려지는데…이것을 두고 사람들이 “수치 처리(Number Crunching)”라 부르는 것을 들어보았을 것입니다. 연구 분야에서는 새로운 약이나 치료법이 유용한지 아닌지를 결정짓는 데에 통계가 사용될 수 있습니다. 사업에서는 새로운 서비스나 신상품을 출시하거나 대중 의견의 경향을 도표화하는 데에 통계가 쓰일 수 있습니다. 수치가 어떻게 수집되고, 분석되어 제시되는지를 보기 위해 “숫자”에 대해 좀 더 살펴봅시다. 통계에 대해 더 안다면, 믿을 것과 믿을 대상에 대하여 더욱 좋은 결정을 내릴 수 있어야 합니다.
수치 처리(Number Crunching)? 하지만 우선, 다음의 두 가지 사실을 기억해 둡시다: 당신이 통계에 대한 기본 개념을 이해하기 위해 수학 전문가가 될 필요는 없습니다. 수학에 대한 기본 지식과 풍부한 상식만 있으면 됩니다. 이것은 “자료(data)”에 대한 것입니다. “자료(data)”라는 단어는 복수형입니다. “정보들은..(The data are..)”이라고 [복수형으로] 말하거나 써서는 안됩니다. “정보는..(The data is)”이라고 [단수형으로] 말하지도 마십시오. 당신이 단지 하나의 수에 대해 말하고 있다면, “자료(datum)”라는 [단수가] 이 경우에 적절한 단어입니다.“
숫자 실제로 모아지는 자료는 때때로 “원자료(raw data)”라고 불립니다. 이는 측정되어 기록된 수치들입니다. 배경음악을 틀어주는 것이 쥐들의 미로 찾기 속도를 앞당겨 줄 수 있는지 없는지를 알아 보고자 한다고 가정해 봅시다. 이 실험에서, 11 마리의 쥐들(1번 쥐 – 11번 쥐)은 음악을 들으며 미로 찾기를 할 것이고, 11마리의 쥐들(12번 쥐 – 22번 쥐)은 음악을 듣지 않은 채 미로를 돌아 다닐 것입니다. 각각의 쥐들이 미로를 통과하는 데에 걸리는 시간을 측정할 것입니다. 각각의 쥐가 미로 찾기를 끝내는 시간(초 단위)을 기록합니다. 원자료는 다음과 같습니다:
초 단위로 측정한 미로 통과 시간
음악을 들려준 집단 음악을 들려주지 않은 집단
쥐 1 = 11.1
쥐 2 = 18.3
쥐 3 = 18.2
쥐 4 = 22.8
쥐 5 = 11.4
쥐 6 = 33.3
쥐 7 = 18.8
쥐 8 = 26.3
쥐 9 = 29.7
쥐 10 = 28.5
쥐 11 = 30.9
쥐 12 = 23.2
쥐 13 = 22.6
쥐 14 = 10.3
쥐 15 = 15.7
쥐 16 = 11.9
쥐 17 = 9.9
쥐 18 = 11.1
쥐 19 = 29.3
쥐 20 = 34.2
쥐 21 = 23.6
쥐 22 = 11.0
평균(mean), 중앙값(median), 최빈치(mode)의 수치를 기술하고 요약하기 위한 몇 가지 방법이 있습니다.
이제 수치를 처리해봅시다! 평균(Mean) “평균(mean)”이란 우리가 보통 “평균치(average)”라고 생각하는 것입니다. 평균은 한 집단의 모든 점수를 더한 값을 그 집단의 총 수로 간단히 나눈 수치입니다. 그렇다면, 우리가 예시로 살펴보았던 미로 찾기를 생각해봅시다: 음악을 들은 집단의 평균은11.1 + 18.3 + 18.2 + 22.8 + 11.4 + 33.3 + 18.8 + 26.3 + 29.7 + 28.5 + 30.9 =22.7
11 “음악을 듣지 않은” 집단의 평균은23.2 + 22.6 + 10.3 + 15.7 + 11.9 + 9.9 + 11.1 + 29.3 + 34.2 + 23.6 + 11.0=18.4
11 (여기서는 이 수치들을 반올림한 것이에요.)
중앙값(Median) 중앙값은 한 집합의 수를 기술하기 위한 또 다른 방법입니다. 중앙값이란 그 수의 집합에서 정확히 중간 지점의 점수를 말합니다. 중앙값을 찾는 가장 쉬운 방법은 숫자들을 순서대로 정렬시켜보는 것입니다. 쥐가 미로를 통과하게 했던 실험에서 음악을 들려준 그룹의 점수 결과를 순서대로 나열한다면, 다음과 같을 것입니다: 11.1, 11.4, 18.2, 18.3, 18.8, 22.8, 26.3, 28.5, 29.7, 30.9, 33.3. 따라서, 22.8보다 높은 기록이 다섯 개(26.3, 28.5, 29.7, 30.9, 33.3) 있고 22.8보다 낮은 기록 또한 다섯 개(11.4, 12.1, 18.2, 18.3, 18.8) 있으므로 중앙값(중간 지점의 점수)은 22.8이 됩니다. “음악을 들려주지 않은” 집단의 중앙값은 여러분이 한번 찾아보세요. 찾은 답이 맞는지 확인해보세요: “음악을 들려주지 않은” 집단의 중앙값은: 바로 15.7입니다. 당신이 가진 자료의 기록이 짝수라면(예를 들어, 11마리의 쥐가 아닌 10마리의 쥐가 미로를 통과하는 시간에 대한 기록), 중앙값은 가운데 두 개의 숫자 사이의 중간 지점이 될 것입니다. 예를 들어, 다음의 숫자들: 1, 2, 4, 6, 17, 20 중; 중앙값은: 4 + 6=5 입니다.
2 홀수의 기록을 가지고 있다면, 중앙값(median)을 알아내기 위해 더하고 나누는 법을 알 필요가 없습니다. 낮은 점수에서 높은 점수로 순서를 매기고 가운데 숫자를 찾아내기만 하면 됩니다.
최빈치(Mode) 최빈치는 일련의 숫자를 기술하기 위한 세 번째 방법입니다. 최빈치는 가장 자주 나타나는 숫자를 말하는 것이므로 찾아내기가 매우 쉽습니다. 예를 들어, 1, 4, 4, 4, 4, 4, 6, 6, 10, 11, 13, 15 이 숫자들 중 4가 가장 많이 보이므로 4가 바로 최빈치가 됩니다. 최빈치는 전체 숫자에 대한 많은 정보를 제시해주는 것이 아니라, 가장 자주 등장하는 점수를 말해주는 것입니다.
한 무리의 숫자에서 평균을 아는 것이 물론 중요하지만, 원자료에서 벗어나는 정보가 더 많습니다. 이를 테면, 한 집단 내에서 한 숫자가 다른 숫자들과 얼마나 비슷한지를 아는 것은 중요합니다. 즉, 한 자료에서 편차(variation)가 어느 정도 벌어지는지를 말할 수 있는 것입니다. 편차를 설명할 수 있는 가장 일반적인 두 가지 방법에는 범위(range)와 표준편차(standard deviation)가 있습니다. 범위(Range) 범위란 하나의 표본 중 최대값과 최소값 사이의 차이를 말합니다. 예를 들어, 2, 2, 2, 7, 8, 9, 10, 11, 11, 15, 20 이 숫자들의 범위는: 20 - 2 = 18입니다. 일부 통계학자들은 때때로 최대값과 최소값을 범위에 포함시키기도 합니다. 이 경우에는, 계산할 때 “1”을 더해줘야 합니다. 이를 테면, 20 - 2 + 1 = 19처럼 말입니다. 범위를 산출해내긴 매우 쉽지만, 이것은 자료(data)의 많은 부분을 보여주지 못하므로 실제 많은 정보를 주지는 못합니다. 범위는 단지 최대값, 최소값과 관계가 있을 뿐입니다. 표준 편차(Standard Deviation) 표준편차는 한 집단의 숫자의 가변성(variability)을 설명하기 위해 과학에서 자주 사용되는 방법입니다. 이것은 평균 주변의 점수 각각에 대한 퍼진 정도(가변성)를 보여주는 것입니다. 자료의 가변성이 증가함에 따라 표준편차도 증가합니다. 자료의 모든 점수가 같다면, 표준편차는 0이 될 것입니다.
계속해서 통계를 배우세요: 자료수집 방법, 자료분석 방법, 자료를 그래프로 만드는 방법, 통계 자료를 책임질 방법.

장문정 번역. 배정옥 검토. 

 

청소년을 위한 신경과학 (tistory.com)

 

청소년을 위한 신경과학

Neuroscience for Kids의 자료를 이 사이트 운영자 Dr. Eric H. Chudler로부터 허가를 받아 번역 게재하고 있다. 이 사이트는 여러 나라의 언어로 번역되고 있다. 차례 신경과학의 세계 (tistory.com) 뇌 기초지

neurosci.tistory.com

 

 

반응형

'Neuroscience for Kids > Neuroscience methods' 카테고리의 다른 글

뇌신경과학 용어집  (0) 2022.12.05
뇌영상기술  (0) 2022.12.03
뇌신경과학의 기본적인 연구방법  (0) 2022.12.03
뇌파 전극 배치: 10-20 체계  (0) 2022.12.03
댓글
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크