텍스트 엔트로피 계산

텍스트의 섀넌 엔트로피, 정보 밀도 및 중복성을 측정합니다.

엔트로피를 계산할 텍스트 입력

위에 콘텐츠를 붙여넣거나 예제를 사용하여 정보 밀도를 측정하세요.

이 예제들 시도

텍스트 엔트로피란 무엇인가요?

섀넌 엔트로피는 정보 이론의 개념으로, 데이터 소스가 생성하는 평균 정보량을 측정합니다. 텍스트의 맥락에서는 문자열 내 문자의 무작위성 또는 예측 불가능성을 정량화합니다.

엔트로피가 높은 문자열은 예측 불가능성이 높고(예: 무작위 비밀번호), 엔트로피가 낮은 문자열은 반복 패턴이 많습니다(예: "aaaaa").

공식

H(X) = -Σ P(xᵢ) log₂ P(xᵢ)
  • H(X): 문자당 비트 단위 엔트로피
  • P(xᵢ): 문자 xᵢ의 확률
  • Σ: 모든 고유 문자 합계