long-tail vs short head

by hexists 2014. 12. 3.
  • long tail, short head ... 많이는 들어봤는데... 정확한 개념을 모르고 있었다.
    • 특별한 계기가 생겨서 개념을 좀 찾아봤다.
  • 일단 IR 책(http://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf)
    • 위 용어를 언급하지 않고 있다.
  • 회사 위키
    • 개념 정의를 정리해 놓은 문서는 없다.
    • 너무 일반적인 개념이라 그런가 싶다.
  • 인터넷 검색
    • 위키에 딱 나온다.
    • 다른 검색 결과도 많이 나온다.
      • 아래에 정리해본다.
  • long-tail
    • 긴 꼬리(The Long Tail), 또는 롱테일 현상은 파레토 법칙을 그래프에 나타냈을 때 꼬리처럼 긴 부분을 형성하는 80%의 부분을 일컫는다.
      (참고로 Chris Anderson이 만든 개념이다.)
    short head
    • short head의 개념을 long-tail 과 비교해 놓은 사이트가 있었다.
    • "Search term" here means the words that people type before they click the Search button, whether it's one word or a phrase. There are very few popular terms, which are repeated thousands of times a day, even in medium site search. These terms tend to be short and general, such as those described in the Google Hot Trends: iphone, webkinz, heroes, club penguin.
      Rich Wiggins of the MSU Library was possibly the first to recognize this pattern in search log analysis, described in his paper The Accidental Thesaurus.Counting the number of times each term is used per day (week, month), and graphing them, he showed that there are a few very popular terms (the Short Head), another set of terms that are repeated quite often (the middle) and a huge number of unique terms (the Long Tail).
      • 대략의 내용을 요약해보면, 검색되는 쿼리들을 보니 자주 반복되는 단어들이 짧고 반복적인 경향(short and general)이 있었다. 
        Rich Wiggins은 논문에서 그러한 term들을 Short Head 라고 정의 했다는 내용이다.

    • The Long Tail and Short Head of Search 
  • 마지막으로 관련 기사가 있어서 첨부한다.

