Blog Archive

레이블이 데이터 분석인 게시물을 표시합니다. 모든 게시물 표시
레이블이 데이터 분석인 게시물을 표시합니다. 모든 게시물 표시

2024-08-06

복수 선택 항목 설문 문항의 통계 처리

온라인 설문지를 만들다보면, 한 질문에 대해 복수 응답이 가능하도록 문항을 만드는 경우가 자주 발생합니다. 예를 들면, "지금 먹고 싶은 과일을 모두 선택하세요."라고 하면, 선택한 과일의 갯수가 0개가 될 수도 있고, 1개가 될 수도 있고, 그보다 많을 수도 있습니다. 

1. 체크박스를 이용한 복수 선택 문항

이런 설문지를 만들 때, 보통은 복수 선택형 체크박스(checkbox)를 사용합니다. 


체크박스로 구현한 복수 응답 설문 문항
체크박스로 구현한 복수 응답 설문 문항


이렇게 문항을 만들면 결과 데이터를 담는 스프레드시트(구글 시트 또는 엑셀 등)의 한 개의 셀에 여러 개 과일 이름이 한꺼번에 들어갑니다. 예를 들면, 셀 하나에 "사과, 수박" 이렇게 값이 들어갑니다. 설문 응답자가 여러 명일 때에, 전체 응답자 중에 "사과"라는 응답이 몇 개 나왔는지 카운트하려면 매우 어렵습니다. 

이런 경우, 텍스트 구분자(이 경우 쉼표)를 기준으로 컬럼을 잘라준 다음, 데이터 분석을 하는 방법이 있고, 그렇지 않으면, 셀 안에 있는 텍스트들을 분석하는 다소 복잡한 수식을 만들어야 합니다. 

결과가 저장된 스프레드 시트. 선택한 응답들이 한 셀에 모두 들어가 있어, 빈도를 분석하기 어렵다
선택한 응답들이 한 셀에 모두 들어가 있어, 빈도를 분석하기가 어렵습니다.

위의 그림에서 총3명의 응답을 분석해보면 사과가 2회, 딸기가 1회, 수박이 2회, 포도가 1회 나왔습니다. 과일 이름이 셀 단위로 분리되지 않았으므로, 셀 안에 있는 특정 단어를 카운트하기 위해서

  1. 3명 응답 전체의 텍스트 길이를 구합니다.
    =sumproduct(len(b$2:b$4) ...
  2. A10 셀에 있는 "포도"라는 단어가 몇 번 나왔는지 카운트하기 위해 "포도"를 제거한 전체 텍스트 길이를 구합니다.
    len(substitute(b$2:b$4,A10,""))
  3. 이제 전체 텍스트 길이에서 포도를 제거한 텍스트 길이를 빼줍니다.
    =sumproduct(len(b$2:b$4)-len(substitute(b$2:b$4,A10,"")))
  4. "포도"라는 단어가 나온 횟수(빈도)를 계산하기 위해 방금 뺀 값 전체를 "포도" 텍스트 길이로 나눠줍니다.
    =sumproduct(...)/len(A10)
이렇게 하면, 각각의 단어가 여러 셀에 걸쳐서 몇 번 출현했는지 빈도를 구할 수 있습니다. 하지만 이 방법은 꽤 번잡하고, 번거롭습니다. 


2. 체크박스 그리드 형식으로 설문을 만들기

구글 설문에서는 "체크박스 그리드" 형식을 선택하면 훨씬 수월하게 통계 처리가 가능합니다. 네이버 폼에서는 문항 형식을 "표형"을 선택하면 됩니다.

체크박스 그리드로 구성한 복수 응답 설문 문항
체크박스 그리드로 구성한 복수 응답 설문 문항

이 경우에는 결과분석 시트가 훨씬 단순하게 나옵니다. 각 응답 항목 하나가 하나의 컬럼으로 분리되어 나오기 때문에, 각 컬럼별로 단어가 들어있는 셀의 갯수만 세어주면 됩니다.

체크박스 그리드 형식의 문항에 대한 결과 시트. 응답 항목 하나가 하나의 셀로 분리가 되어 빈도 계산이 훨씬 쉽다.
응답 항목 하나가 하나의 셀로 분리가 되어 빈도 계산이 훨씬 쉽습니다.


즉, 위의 그림에서는 컬럼 C에 사과, D에 딸기, E에 수박, F에 포도라는 응답이 분리되어 저장되므로, 각각의 빈도만 계산해주면 됩니다. 예를 들어, 포도라는 응답이 나온 횟수를 계산하기 위해, 포도 컬럼에서 "선택"이라는 단어가 몇 개 있는지만 세어주면 됩니다.

=countif(f2:f4, "선택")

3. 결론

특별한 경우가 아니라면, 복수 응답을 받아야 하는 설문지를 설계한다면, 단순한 체크박스 형식으로 문항을 만들지 말고, 결과 처리를 미리 생각해서, 체크박스 그리드로 만드는 것이 훨씬 좋습니다. 

그러나, 이미 체크박스 형식으로 설문지를 만들어서, 응답들이 한 셀에 모두 한꺼번에 들어가 있을 수 있습니다. 위에서 소개한 대로, 찾고자 하는 항목의 텍스트 길이와 전체 텍스트 길이를 계산해주면, 그 항목의 출현 빈도를 계산할 수 있으니, 천천히 해보시기 바랍니다.