트윗 내용 만으로 성별·나이 알아낸다

트윗 내용 만으로 성별·나이 알아낸다

입력 2013-05-14 00:00
업데이트 2013-05-14 11:55
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14
트위터에 올라온 글의 내용만으로 작성자의 성별과 나이를 맞추는 온라인 프로그램이 개발됐다.

네덜란드 트웬테대학교 연구팀은 3천 명가량의 트위터 사용자 글에 나타난 단어 및 어구 등을 성별과 나이에 따라 분석해 이같은 프로그램을 개발했다고 13일 밝혔다.

단순히 이름만 입력하면 그 사람이 최근에 게시한 글 200개를 자체 데이터베이스의 단어와 어구와 비교해 작성자의 성별과 나이를 산출해 낼 수 있다는 것이다.

트웬테대에서 컴퓨터과학 박사과정을 밟고 있는 동 응우옌은 “남성과 여성의 차이점은 매우 전형적”이라면서 “남자들은 축구에 대해 이야기하고 여자들은 손톱에 대한 얘기를 많이 한다”고 말했다.

이어 나이를 구분하는 방법에 대해서는 “젊은 사람들은 주로 자신에 대해 이야기하며 이모티콘을 많이 사용하지만 나이 든 사람들은 긴 단어와 문장을 즐겨 사용한다”고 밝혔다.

현재 네덜란드어 트위터 메시지 분석만 지원하는 이 프로그램은 오차범위가 4살이다. 젊은 사용자들의 오차범위는 낮은 반면, 나이 든 사용자로 갈수록 오차 범위가 커지는 경향이 있다.

응우옌은 “35세 이상의 사용자들은 더 정형화된 언어를 사용한다”면서 “15세와 20세의 언어는 불과 다섯살 차이라도 큰 차이가 있지만 45세의 경우는 10년 정도의 격차는 나야 사용하는 언어에 차이가 나타난다”고 밝혔다.

트웬테대 연구진은 메이르텐스 네덜란드언어문화연구소와 함께 다국어 지원 서비스를 제공하고 페이스북 등 다른 소셜네트워크 사이트에도 프로그램을 적용하는 방식을 고려하고 있다.

연합뉴스

많이 본 뉴스
핵무장 논쟁, 당신의 생각은?
정치권에서 ‘독자 핵무장’과 관련해 다양한 의견이 나오고 있습니다. 러시아와 북한의 밀착에 대응하기 위해 핵무장이 필요하다는 의견과 평화와 경제에 악영향을 미칠 수 있어 반대한다는 의견이 맞서고 있습니다. 당신의 생각은?
독자 핵무장 찬성
독자 핵무장 반대
사회적 논의 필요
모르겠다
광고삭제
위로