(번역) Harmonic mean

수학(mathematics)에서, 조화 평균은 여러 종류의 평균(average) 중 하나이고, 특히, 피타고라스 평균(Pythagorean means) 중 하나입니다. 그것은 전형적으로 비율(rate)의 평균이 요구될 때 상황에 대해 적합합니다.

조화 평균은 주어진 관측의 집합의 역수(reciprocal)의 산술 평균(arithmetic mean)의 역수로 표현될 수 있습니다. 간단한 예제로서, 1, 4, 및 4의 조화 평균은 다음과 같습니다:

\(\quad\)\(\displaystyle \left(\frac{1^{-1} + 4^{-1} + 4^{-1}}{3}\right)^{-1} = \frac{3}{\frac{1}{1} + \frac{1}{4} + \frac{1}{4}} = \frac{3}{1.5} = 2\,.\)

Definition

양의 실수(real number) \(x_1, x_2, \ldots, x_n\)의 조화 평균 H는 다음으로 정의됩니다:

\(\quad\)\(\displaystyle H = \frac{n}{\frac1{x_1} + \frac1{x_2} + \cdots + \frac1{x_n}} = \frac{n}{\sum\limits_{i=1}^n \frac1{x_i}} = \left(\frac{\sum\limits_{i=1}^n x_i^{-1}}{n}\right)^{-1}.\)

위 방정식에서 세 번째 공식은 역수의 산술 평균의 역수로 조화 평균을 표현합니다.

다음 공식에서:

\(\quad\)\(\displaystyle H = \frac{n\cdot \prod\limits_{j=1}^n x_j}{ \sum\limits_{i=1}^n \left\{\frac{1}{x_i}{\prod\limits_{j=1}^n x_j}\right\}}.\)

조화 평균이 산술(arithmetic) 및 기하 평균(geometric mean)과 관련이 있다는 것이 더 분명합니다. 그것은 양수 입력에 대한 산술 평균(arithmetic mean)의 역수 이중(dual)입니다.

\(\quad\)\(\displaystyle 1/H(1/x_1 \ldots 1/x_n) = A(x_1 \ldots x_n)\)

조화 평균은 슈어-오목 함수이고, 임의의 양의 인수의 집합에 대해, \(\min(x_1 \ldots x_n) \le H(x_1 \ldots x_n) \le n \min(x_1 \ldots x_n)\)라는 의미에서, 그것의 인수의 최솟값에 의해 지배됩니다. 따라서, 조화 평균은 일부 값을 더 큰 값으로 변경함으로써 임의적으로 크게(arbitrarily large) 만들 수 없습니다 (최소 하나의 값은 변경되지 않음).

조화 평균은 역시 오목(concave)이며, 이것은 슈어-오목성보다 훨씬 더 강력한 속성입니다. 만약 음의 값이 사용되면 평균이 오목하지 않기 때문에, 우리는 오직 양수를 사용하도록 주의해야 합니다.

Relationship with other means

조화 평균은 셋의 피타고라스 평균(Pythagorean means) 중 하나입니다. 적어도 한 쌍의 동일하지 않은 값을 포함하는 모든 양의 데이터 집합에 대해, 조화 평균은 항상 셋의 평균 중 최솟값이고,[3] 반면에 산술 평균(arithmetic mean)은 항상 세 가지 중 가장 크고 기하 평균(geometric mean)은 항상 그 사이에 있습니다. (만약 비-빈 데이터집합에서 모든 값이 같으면, 세 가지 평균은 항상 서로 같습니다; 예를 들어, {2, 2, 2}의 조화, 기하, 및 산술 평균은 모두 2입니다.)

그것은 거듭제곱 평균(power mean)의 특별한 경우 \(M_{-1}\)입니다:

\(\quad\)\(\displaystyle H\left(x_1, x_2, \ldots, x_n\right) = M_{-1}\left(x_1, x_2, \ldots, x_n\right) = \frac{n}{x_1^{-1} + x_2^{-1} + \cdots + x_n^{-1}}\)

숫자 목록의 조화 평균은 목록의 최소 원소쪽으로 강하게 향하기 때문에, 그것은 (산술 평균에 비해) 큰 이상값의 영향을 완화하고 작은 이상값의 영향을 악화시키는 경향이 있습니다.

산술 평균은 종종 조화 평균을 요구하는 장소에서 잘못 사용됩니다. 예를 들어 아래의 속력 예제에서, 산술 평균 40이 잘못되었고, 너무 큽니다.

조화 평균은 아래 방정식에서 볼 수 있듯이 다른 피타고라스 평균과 관련이 있습니다. 이것은 분모를 n 번 숫자의 곱의 산술 평균으로 해석하지만 매번 j-번째 항을 생략함으로써 알 수 있습니다. 즉, 첫 번째 항에 대해, 우리는 첫 번째를 제외한 모든 n 개의 숫자를 곱합니다; 두 번째에 대해, 우리는 두 번째를 제외한 모든 n 개의 숫자를 곱합니다; 그리고 이런 식으로 계속됩니다. 산술 평균과 함께 사용되는 n을 제외한 분자는 거듭제곱 n의 기하 평균입니다. 따라서 n-번째 조화 평균은 n-번째 기하 및 산술 평균과 관련이 있습니다. 일반 공식은 다음입니다:

\(\quad\)\(\displaystyle H\left(x_1, \ldots, x_n\right) =
  \frac{\left(G\left(x_1, \ldots, x_n\right)\right)^n}
       {A\left(x_2 x_3 \cdots x_n, x_1 x_3 \cdots x_n, \ldots, x_1 x_2 \cdots x_{n-1}\right)} =
  \frac{\left(G\left(x_1, \ldots, x_n\right)\right)^n}
       {A\left(
         \frac{1}{x_1} {\prod\limits_{i=1}^n x_i},
         \frac{1}{x_2} {\prod\limits_{i=1}^n x_i},
         \ldots,
         \frac{1}{x_n} {\prod\limits_{i=1}^n x_i}
       \right)}.
\)

만약 비-동일한 숫자의 집합이 평균-보존하는 확산(mean-preserving spread)에 적용되면 – 즉, 집합의 둘 이상의 원소가 산술 평균을 변경하지 않는 동안 서로로부터 "확산"되면 – 조화 평균은 항상 감소합니다.

Harmonic mean of two or three numbers

단지 두 원소, \(x_1\)과 \(x_2\)의 특별한 경우에 대해, 조화 평균은 다음처럼 쓰여질 수 있습니다:

\(\quad\)\(\displaystyle H = \frac{2x_1 x_2}{x_1 + x_2} \qquad \) 또는 \(\displaystyle \qquad \frac{1}{H} = \frac{(1/x_1) + (1/x_2)}{2}.\)

이 특별한 경우에서, 조화 평균은 산술 평균(arithmetic mean) \(A = \frac{x_1 + x_2}{2}\)와 기하 평균(geometric mean) \(G = \sqrt{x_1 x_2}\)를 다음에 의해 관련됩니다:

\(\quad\)\(\displaystyle H = \frac{G^2}{A} = G \cdot \left(\frac{G}{A}\right).\)

산술과 기하 평균의 부등식(inequality of arithmetic and geometric means)에 의해 G A ≤ 1

이기 때문에, 이것은 n = 2 경우에 대해 H ≤ G임을 보여줍니다 (사실 모든 n에 대해 유지되는 속성입니다). 그것은 역시 G = A H

임을 따르며, 두 숫자의 기하 평균이 그것들의 산술과 조화 평균의 기하 평균과 같음을 의미합니다.

Three numbers

세 숫자, \(x_1\), \(x_2\)와 \(x_3\)의 특별한 경우에 대해, 조화 평균은 다음처럼 쓰여질 수 있습니다:

\(\quad\)\(\displaystyle H = \frac{3 x_1 x_2 x_3}{x_1 x_2 + x_1 x_3 + x_2 x_3}.\)

셋의 양수 H, G 및 A는 각각 셋의 양수의 조화, 기하 및 산술 평균인 것과 다음 부등식이 유지되는 것은 필요충분(iff) 조건입니다:

\(\quad\)\(\displaystyle \frac{A^3}{G^3} + \frac{G^3}{H^3} + 1 \le \frac3{4} \left(1 + \frac{A}{H}\right)^2.\)

Weighted harmonic mean

만약 가중(weights) \(w_1, \cdots, w_n\)의 집합이 데이터집합 \(x_1, \cdots, x_n\)과 결합되면, 가중된 조화 평균은 다음에 의해 정의됩니다:

\(\quad\)\(\displaystyle H = \frac{\sum\limits_{i=1}^n w_i}{\sum\limits_{i=1}^n \frac{w_i}{x_i}}
= \left( \frac{\sum\limits_{i=1}^n w_i x_i^{-1}}{\sum\limits_{i=1}^n w_i} \right)^{-1}.
\)

비가중된 조화 평균은 가중의 모두가 같은 특수한 경우로 여겨질 수 있습니다.

Examples

In physics

율(rate)과 비율(ratio)과 관련된 많은 상황에서, 조화 평균은 정확한 평균(average)을 제공합니다. 예를 들어, 만약 차량이 속력 x (예를 들어, 60 km/h)에서 밖으로 특정 거리 d를 이동하고 속력 y (예를 들어, 20 km/h)에서 같은 거리를 되돌아오면, 그것의 평균 속력은 x와 y의 조화 평균 (30 km/h)입니다 – 산술 평균 (40 km/h)이 아닙니다. 전체 이동 시간은 그것이 해당 평균 속력에서 전체 거리를 이동한 것과 같습니다. 이것은 다음과 같이 입증될 수 있습니다:

\(\rm{전체 여정의 평균 속력} = \frac{\rm{이동한 전체 거리}}{\rm{각 구간에 대한 시간의 합}}=\frac{2d}{\frac{d}{x}+\frac{d}{y}}=\frac{2}{\frac{1}{x}+\frac{1}{y}}

어쨌든, 만약 차량이 속력 x에서 특정 총 시간 동안 이동하고 그런-다음 속력 y에서 같은 시간 동안 이동하면 그것의 평균 속력은 x와 y의 산술 평균(arithmetic mean)이며, 위의 예제에서 40 km/h입니다. 같은 원칙이 둘보다 많은 구간에 적용됩니다: 서로 다른 속력으로 일련의 부분-여행이 주어지면, 만약 각 부분-여행이 같은 거리를 가면, 평균 속력은 모든 부분-여행 속력의 조화 평균입니다; 그리고 만약 각 부분-여행이 같은 총 시간이 걸리면, 평균 속력는 모든 부분-여행 속력의 산술 평균입니다. (만약 두 경우 모두에 해당하지 않으면, 가중된 조화 평균(weighted harmonic mean) 또는 가중된 산술 평균(weighted arithmetic mean)이 필요합니다. 산술 평균에 대해, 이동의 각 부분의 속력이 해당 부분의 지속 시간에 의해 가중되고, 반면에 조화 평균에 대해 해당 가중은 거리입니다. 두 경우 모두에서, 결과 공식은 전체 거리를 전체 시간으로 나눈 것으로 줄어듭니다.)

어쨌든, 우리는 "거리에 의한 가중"의 경우에 대해 조화 평균의 사용을 피할 수 있습니다. (킬로미터 당 시간에서) "느림"이 속력의 역인 여정의 "느림"을 찾는 것으로 문제를 제기하십시오. 이동 느림이 발견될 때, "진정한" 평균 주행 속력을 찾기 위해 그것을 역으로 만드십시오. 각 여행 구간 i에 대해, 느림 \(s_i = 1/speed_i\)입니다. 그런-다음 각각의 거리에 의해 가중된 \(s_i\)의 가중된 산술 평균(arithmetic mean)을 취하십시오 (선택적으로 가중을 정규화하므로 그것들은 여행 길이로 나눔으로써 합계가 1이 됩니다). 이것은 실제 평균 (킬로미터 당 시간에서) 느림을 제공합니다. 조화 평균의 지식없이 수행될 수 있는 이 절차는 조화 평균을 사용함으로써 이 문제를 해결하는 데 사용하는 것과 같은 수학적 연산에 해당합니다. 따라서 이 경우에서 조화 평균이 작동하는 이유를 설명합니다.

Density

유사하게, 만약 우리가 구성 요소의 밀도와 질량 분수 (또는, 동등하게 질량의 백분율)가 주어진 합금의 밀도를 추정하기를 원하면, 합금(alloy)의 예상된 밀도 (전형적으로 원자 패킹 효과로 인한 작은 부피 변화 제외)는 처음에 예상할 수 있는 가중된 산술 평균이 아니라 질량에 의해 가중된 개별 밀도의 가중된 조화 평균입니다. 가중된 산술 평균을 사용하기 위해, 밀도가 부피에 의해 가중되어야 합니다. 요소별로 질량 단위에 이름을 지정하고 오직 같은 요소-질량 취소를 확인하는 동안 문제에 차원 해석(dimensional analysis)을 적용하면 이것을 명확하게 만듭니다.

Electricity

만약 우리가 하나는 저항 x (예를 들어 60 Ω)을 가지고 하나는 저항 y (예를 들어 40 Ω)를 가지는 두 개의 전기 저항(resistor)을 병렬로 연결하면, 효과는 만약 우리가 같은 저항을 가진 두 개의 저항을 사용하면 같으며, 둘 다는 x와 y의 조화 평균 (48 Ω)과 같습니다: 등가 저항은, 두 경우에서, 24 Ω (조화 평균의 절반)입니다. 이 같은 원리는 직렬로 연결된 축전기(capacitor) 또는 병렬로 연결된 유도자(inductor)에 적용됩니다.

어쨌든, 만약 우리가 저항을 직렬로 연결하면, 평균 저항은 x와 y의 산술 평균입니다 (전체 저항은 x와 y의 합과 같습니다). 이 같은 원리는 병렬로 연결된 축전기(capacitor) 또는 직렬로 연결된 유도자(inductor)에 적용됩니다.

앞의 예와 마찬가지로, 같은 원리는 둘 이상의 저항, 축전기 또는 유도자가 연결될 때 적용되며, 모두 병렬로 연결되거나 모두 직렬로 연결되는 조건 아래에서 그렇습니다.

반도체의 "전도성 유효 질량"은 역시 세 가지 결정학적 방향에 따른 유효 질량의 조화 평균으로 정의됩니다.

Optics

다른 광학 방정식(optic equation)에 대해, 얇은 렌즈 방정식 \(frac{1}{f}=\frac{1}{u}= \frac{1}{v}\)은 초점 거리 f가 렌즈에서 피사체 u와 피사체 v의 거리의 조화 평균의 절반을 만족하도록 다시 작성될 수 있습니다.

In finance

가중 조화 평균은 가격–수익 비율(price–earnings ratio) (P/E)와 같은 배수를 평균화하는 데 선호되는 방법입니다. 만약 이들 비율이 가중 산술 평균을 사용하여 평균화되면, 높은 데이터 점은 낮은 데이터 점보다 더 큰 가중치가 부여됩니다. 가중 조화 평균은, 다른 한편으로, 각 데이터 점에 올바르게 가중치를 부여합니다. P/E와 같은 비-가격 정규화 비율에 적용될 때 단순 가중 산술 평균은 상향 편향되고 수치적으로 절대 정당화될 수 없는데, 왜냐하면 그것은 균등화된 수익을 기반으로 하기 때문입니다; 차량 속력이 왕복 여행에 대해 평균을 낼 수 없는 것처럼과 같습니다 (위를 참조하십시오).

예를 들어, 두 회사, 1,500억 달러의 시가 총액(market capitalization)과 50억 달러의 수익 (P/E 30)을 갖는 하나와 10억 달러의 시가 총액과 100만 달러의 수익 (P/E 1000)을 갖는 하나를 생각해 보십시오. 두 주식으로 구성된 지수를 생각해 보십시오. 두 종목, 첫 번째 종목에 30%와 두 번째 종목에 70%를 갖는 것으로 구성된 지수(index)를 생각해 보십시오. 우리는 이 지수의 P/E를 계산하기를 원합니다.

가중 산술 평균을 사용 (부정확):

\(\quad\)\(P/E = 0.3 \times 30 + 0.7 \times 1000 = 709\)

가중 조화 평균을 사용 (정확):

\(\quad\)\(\displaystyle P/E = \frac{0.3 + 0.7}{0.3/30 + 0.7/1000} \approx 93.46\)

따라서, 이 지수의 93.46의 정확한 P/E는 가중 조화 평균을 사용해야만 찾을 수 있고, 반면에 가중 산술 평균은 이를 상당히 과대평가할 것입니다.

In geometry

임의의 삼각형(triangle)에서, 내원(incircle)의 반지름은 고도(altitudes)의 조화 평균의 1/3입니다.

등변 삼각형(equilateral triangle) ABC의 둘레원(circumcircle)의 보조 호(minor arc) BC에 있는 임의의 점 P에 대해, B와 C로부터 각각 거리 q와 t을 갖고, PA와 BC의 교점은 점 P에서 거리 y에 있으며, 우리는 y는 q와 t의 조화 평균의 절반임을 가집니다.

다리가 a와 b를 갖고 빗변(hypotenuse)에서 직각까지의 고도(altitude) h를 갖는 직각 삼각형(right triangle)에서, h²는 a²과 b²의 조화 평균의 절반입니다.

t와 s (t > s)를 빗변 c를 갖는 둘의 직각 삼각형에 내접된 정사각형의 변으로 놓습니다. 그런-다음 s²는 c²과 t²의 조화 평균의 절반과 같습니다.

사다리꼴(trapezoid)이 순서대로 꼭짓점 A, B, C, 및 D를 가지고 변 AB와 CD가 평행하다고 놓습니다. E를 대각선(diagonal)의 교차점으로 놓고, FEG가 AB 및 CD와 평행하도록 F를 변 DA 위에 있고 G를 변 BC 위에 있다고 놓습니다. 그런-다음 FG는 AB와 DC의 조화 평균입니다. (이것은 닮은 삼각형을 사용하여 증명할 수 있습니다.)

이 사다리꼴 결과의 한 가지 응용은 교차 사다리 문제(crossed ladders problem)에 있으며, 여기서 두 개의 사다리가 골목을 가로질러 반대 방향으로 놓여 있으며, 각각의 발은 한쪽 측벽의 바닥에 있고, 그림처럼 하나는 높이 A의 벽에 기대어 있고 다른 하나는 높이 B의 반대쪽 벽에 기대어 있습니다. 사다리는 골목 바닥에서 h 높이로 교차합니다. 그런-다음 h는 A와 B의 조화 평균의 절반입니다. 이 결과는 벽이 기울어졌지만 여전히 평행하고 "높이" A, B, 및 h가 벽과 평행한 직선을 따라 바닥으로부터의 거리로 측정되는 경우에도 여전히 유효합니다. 이것은 사다리꼴의 넓이 공식과 넓이 덧셈 공식을 사용하여 쉽게 입증될 수 있습니다.

타원(ellipse)에서, 반-래투스 렉텀(semi-latus rectum) (보조 축에 평행한 직선을 따라 초점에서 타원까지의 거리)은 초점에서 타원의 최대와 최소 거리의 조화 평균입니다.

In other sciences

컴퓨터 과학(computer science), 특히 정보 검색(information retrieval)과 기계 학습(machine learning)에서, 정밀도(precision) (예측된 긍정당 참 긍정)와 재현율(recall) (실제 긍정당 참 긍정)의 조화 평균은 알고리듬과 시스템 평가를 위해 집계된 성능 점수: F-점수(F-score) (또는 F-측정)로 종종 사용됩니다. 이것은 오직 긍정 클래스가 관련성(relevance)이 있고, 반면에 부정의 숫자는, 일반적으로, 크고 알려져 있지 않기 때문에 정보 검색에 사용됩니다. 따라서 정확한 긍정 예측이 예측된 긍정의 수 또는 실제 긍정의 수와 관련하여 측정되어야 하는지 여부에 대한 트레이드-오프이므로, 둘의 가능한 분모의 산술 평균인 추정상의 긍정의 수에 대해 측정됩니다.

결과는 사람이나 시스템이 함께 작동하는 문제에서 기본 대수에서 발생합니다. 예를 들어, 만약 가스-구동식 펌프가 4시간 내에 수영장을 배수할 수 있고 배터리-구동식 펌프가 6시간 내에 같은 수영장을 배수할 수 있으면, 그것은 두 펌프에 의해 \(\frac{6\cdot 4}{6+4}\)를 걸리며, 함께 수영장을 배수하기 위해 2.4 시간과 같습니다. 이것은 6과 4의 조화 평균: \(\frac{2\cdot 6 \cdot 4}{6+4}=4.8\)의 절반입니다. 즉, 두 가지 유형의 펌프에 대한 적절한 평균은 조화 평균이고, 한 쌍의 펌프 (둘의 펌프)에서, 이 조화 평균 시간의 절반이 걸리고, 반면에 두 쌍의 펌프 (넷의 펌프)와 함께, 그것은 이 조화 평균 시간의 4분의 1이 걸릴 것입니다.

수문학(hydrology)에서, 조화 평균은 층 (예를 들어, 지질 또는 토양)에 수직인 흐름에 대해 유압 전도도(hydraulic conductivity) 값을 평균화하기 위해 유사하게 사용됩니다 – 층에 평행한 흐름은 산술 평균을 사용합니다. 평균화에서 이러한 명백한 차이는 수문학이 저항의 역수인 전도도를 사용한다는 사실에 의해 설명됩니다.

세이버메트릭스(sabermetrics)에서, 선수의 힘–속력 숫자(Power–speed number)는 전체 홈런(home run)과 전체 도루(stolen base)의 조화 평균입니다.

인구 유전학(population genetics)에서, 조화 평균은 유효 인구 규모에 대한 조사 인구 규모의 변동의 효과를 계산할 때 사용됩니다. 조화 평균은 인구 병목 현상(bottleneck)과 같은 사건이 인구에서 유전적 드리프트 율을 증가시키고 유전적 변이의 총양을 감소시킨다는 사실을 고려합니다. 이것은 병목 현상을 따르는 극소수의 개인이 많은 다음 세대에 걸쳐 인구에 존재하는 유전적 변이를 제한하는 유전자 풀(gene pool)에 기여한다는 사실의 결과입니다.

자동차에서 연비(fuel economy in automobiles)를 고려할 때, 두 측정은 공통적으로 갤런당 마일 (mpg)과 100km당 리터를 사용합니다. 이들 양의 치수는 서로의 역수이므로 (하나는 부피당 거리이고, 나머지 하나는 거리당 부피임) 자동차 영역의 연비 평균값을 취할 때 한 측정값은 나머지 측정값의 조화 평균을 생성할 것입니다 – 예를 들어, 100km당 리터로 표시되는 연비의 평균값을 갤런당 마일로 변환하면 갤런당 마일로 표시되는 연비의 조화 평균이 생성될 것입니다. 개별 연료 소비량에서 차량의 평균 연료 소비량을 계산하려면 차량이 갤런당 마일을 사용하면 조화 평균이 사용되어야 하고, 반면에 차량이 100km당 리터를 사용하면 산술 평균이 사용되어야 합니다. 미국에서, CAFE 표준(CAFE standards) (연방 자동차 연료 소비 표준)은 조화 평균을 사용합니다.

화학(chemistry) 및 핵 물리학(nuclear physics)에서, 서로 다른 종 (예를 들어, 분자 또는 동위원소)으로 구성된 혼합물의 입자당 평균 질량은 각 종의 질량 분수에 의해 가중된 개별 종의 질량의 조화 평균에 의해 제공됩니다.

Beta distribution

모양 매개변수 α와 β를 갖는 베타 분포(beta distribution)의 조화 평균은 다음과 같습니다:

\(\quad\)\(\displaystyle H = \frac{\alpha - 1}{\alpha + \beta - 1} \text{ conditional on } \alpha > 1 \, \, \& \, \, \beta > 0 \)

α < 1을 갖는 조화 평균은 정의 표현식이 [0, 1]에 경계지기 않기 때문에 정의되지 않습니다.

α = β라고 놓으면

\(\quad\)\(\displaystyle H = \frac{\alpha - 1}{2 \alpha - 1}\)

α = β에 대해 조화 평균의 범위는 α = β = 1에 대한 0에서, α = β → ∞에 대한 1/2까지임을 보여줍니다.

다음은 하나의 매개변수가 유한 (비-영)이고 다른 매개변수가 이들 한계에 접근하는 극한입니다:

\(\quad\)\(\begin{align}
  \lim_{\alpha \to 0} H &= \text{ undefined } \\
  \lim_{\alpha \to 1} H &= \lim_{\beta \to \infty}  H = 0 \\
  \lim_{\beta \to 0}  H &= \lim_{\alpha \to \infty} H = 1
\end{align}\)

기하 평균과 함께 조화 평균은 넷의 매개변수에서 최대 가능성 추정에 유용할 수 있습니다.

이차 조황 평균 \((H_{1-X})\)이 역시 이 분포에 대해 존재합니다.

\(\quad\)\(\displaystyle H_{1-X} = \frac{\beta - 1}{\alpha + \beta - 1} \text{ conditional on } \beta > 1 \, \, \& \, \, \alpha > 0\)

β < 1을 갖는 이 조화 평균은 그것의 정의 표현식이 [ 0, 1 ]에 경계지지 않기 때문에 정의되지 않습니다.

위의 표현에서 α = β라고 놓으면

\(\quad\)\(\displaystyle H_{1-X} = \frac{\beta - 1}{2 \beta - 1} \)

α = β에 대해 조화 평균 범위는 α = β = 1에 대한 0에서, α = β → ∞에 대한 1/2까지임을 보여줍니다.

다음은 하나의 매개변수가 유한 (비-영)이고 다른 매개변수가 이들 한계에 접근하는 극한입니다:

\(\quad\)\(\begin{align}
  \lim_{\beta \to 0}  H_{1-X} &= \text{ undefined } \\
  \lim_{\beta \to 1}  H_{1-X} &= \lim_{\alpha \to \infty} H_{1-X} = 0 \\
  \lim_{\alpha \to 0} H_{1-X} &= \lim_{\beta \to \infty}  H_{1-X} = 1
\end{align}\)

비록 두 조화 평균이 비대칭이지만, α = β일 때 두 평균은 같습니다.

Lognormal distribution

로그-정규 분포(lognormal distribution)의 조화 평균 ( H )는

\(\quad\)\(\displaystyle H = \exp \left( \mu - \frac{1}{2} \sigma^2 \right),\)

여기서 μ는 분포의 산술 평균이고 \(\sigma^2\)은 분포의 분산입니다.

조화 평균과 산술 평균은 다음에 의해 관련되어 있습니다:

\(\quad\)\(\displaystyle \frac{\mu}{H} = 1 + C_v \, ,\)

여기서 \(C_v\)는 변동 계수(coefficient of variation)입니다.

기하 (G), 산술, 및 조화 평균은 다음에 의해 관련됩니다:

\(\quad\)\(H \mu = G^2.\)

Pareto distribution

유형 1 파레토 분포(Pareto distribution)의 조화 평균은 다음입니다:

\(\quad\)\(\displaystyle H = k \left( 1 + \frac{1}{\alpha} \right)\)

여기서 k는 스칼라 매개변수이고 α는 모양 매개변수입니다.

Statistics

무작위 표본에 대해, 조화 평균은 위와 같이 계산됩니다. 평균(mean)과 분산(variance) 둘 다는 무한(infinite)일 수 있습니다 (만약 그것이 형식 1/0의 적어도 하나의 항을 포함하면).

Sample distributions of mean and variance

표본 m의 평균은 분산 \(s^2\)을 갖는 정규적으로 점근적으로 분포됩니다.

\(\quad\)\(\displaystyle s^2 = \frac{m \left[\operatorname{E}\left(\frac{1}{x} - 1\right)\right]}{m^2 n}\)

평균 자체의 분산은 다음입니다:

\(\quad\)\(\displaystyle \operatorname{Var}\left(\frac{1}{x}\right) = \frac{m \left[\operatorname{E}\left(\frac{1}{x} - 1\right)\right]}{n m^2}\)

여기서 m은 역수의 산술 평균, x는 변량, n은 모집단 크기이고 E는 기대값 연산자입니다.

Delta method

분산이 무한하지 않고 중심 극한 정리(central limit theorem)가 표본에 적용된다고 가정하면 델타 방법(delta method)을 사용하여, 분산은 다음과 같습니다:

\(\quad\)\(\displaystyle \operatorname{Var}(H) = \frac{1}{n}\frac{s^2}{m^4}\)

여기서 H는 조화 평균, m은 역수의 산술 평균입니다:

\(\quad\)\(\displaystyle m = \frac{1}{n} \sum{ \frac{1}{x} }.\)

\(s^2\)은 데이터의 역수의 분산입니다:

\(\quad\)\(\displaystyle s^2 = \operatorname{Var}\left( \frac{1}{x} \right)\)

그리고 n은 표본에서 데이터 점의 숫자입니다.

Jackknife method

평균이 알려져 있으면, 분산을 추정하는 잭나이프(jackknife) 방법이 가능합니다. 이 방법은 'delete m' 버전이 아닌 보통의 'delete 1'입니다.

이 방법은 먼저 표본의 평균 (m)의 계산을 요구합니다:

\(\quad\)\(\displaystyle m = \frac{n}{ \sum{ \frac{1}{x} } }\)

여기서 x는 표본 값입니다.

그런-다음 일련의 값 \(w_i\)가 여기서 계산됩니다:

\(\quad\)\(\displaystyle w_i = \frac{n - 1}{ \sum_{j \neq i} \frac{1}{x} }.\)

\(w_i\)의 평균 (h)는 그런-다음 다음과 같이 취해집니다:

\(\quad\)\(\displaystyle h = \frac{1}{n} \sum{w_i}\)

평균의 분산은 다음과 같습니다:

\(\quad\)\(\displaystyle \frac{n - 1}{n} \sum{(m - w_i)}^2.\)

평균에 대해 유의성 테스팅과 신뢰 구간(confidence interval)은 그런-다음 t 테스트(t test)로 추정될 수 있습니다.

Size biased sampling

무작위 변량이 분포 f(x)를 갖는다고 가정합니다. 역시 변량이 선택될 가능성은 그 값에 비례한다고 가정합니다. 이것은 길이 기반 또는 크기 편향 표본화로 알려져 있습니다.

μ를 모집단의 평균으로 놓습니다. 그런-다음 크기 편향된 모집단의 확률 밀도 함수(probability density function) \(f^*(x)\)는 다음입니다:

\(\quad\)\(\displaystyle f^*(x) = \frac{x f(x)}{\mu}\)

이 길이 편향된 분포 \(\operatorname{E}^*(x)\)의 기댓값은 다음입니다:

\(\quad\)\(\displaystyle \operatorname{E}^*(x) = \mu \left[ 1 + \frac{\sigma^2}{\mu^2} \right]\)

여기서 \(\sigma^2\)은 분산입니다.

조화 평균의 기댓값은 비-길이 편향된 버전 E( x )와 같습니다:

\(\quad\)\(\displaystyle E^*( x^{ -1 } ) = E( x )^{ -1 } \)

길이 편향된 표본화의 문제는 섬유 제조 가계도 분석과 생존 분석을 포함한 여러 영역에서 발생합니다.

Akman et al.은 표본에서 길이 기반 편향을 감지하기 위한 테스트를 개발해 왔습니다.

Shifted variables

만약 X가 양의 확률 변수이고 q > 0이면 모든 ε > 0에 대해:

\(\quad\)\(\displaystyle \operatorname{Var} \left[\frac{1}{(X + \epsilon)^q}\right] < \operatorname{Var} \left(\frac{1}{X^q}\right) .\)

Moments

X와 E(X)가 > 0로 가정하면:

\(\quad\)\(\displaystyle \operatorname{E}\left[ \frac{1}{X} \right] \ge \frac{1}{ \operatorname{E}(X) }\)

이것은 옌센 부등식(Jensen's inequality)에서 비롯됩니다.

Gurland는 임의의 n > 0에 대해, 오직 양수 값을 취하는 분포에 대해 다음임을 보여주었습니다:

\(\quad\)\(\displaystyle \operatorname{E} \left(X^{-1}\right) \ge \frac{\operatorname{E} \left(X^{n-1}\right)}{\operatorname{E}\left(X^n\right)} .\)

일부 조건 아래에서

\(\quad\)\(\displaystyle \operatorname{E}(a + X)^{-n} \sim \operatorname{E}\left(a + X^{-n}\right)\)

여기서 ~는 근사적임을 의미합니다.

Sampling properties

변량 (x)이 로그정규 분포에서 추출되었다고 가정하면 H에 대해 몇 가지 가능한 추정기가 있습니다:

\(\quad\)\(\begin{align}
  H_1 &= \frac{n}{ \sum\left(\frac{1}{x}\right) } \\
  H_2 &= \frac{\left( \exp\left[ \frac{1}{n} \sum \log_e(x) \right] \right)^2}{ \frac{1}{n} \sum(x) } \\
  H_3 &= \exp \left(m - \frac{1}{2} s^2 \right)
\end{align}\)

여기서

\(\quad\)\(\displaystyle m = \frac{1}{n} \sum \log_e (x)\)

\(\quad\)\(\displaystyle s^2 = \frac{1}{n} \sum \left(\log_e (x) - m\right)^2\)

이들 중 \(H_3\)는 아마도 25 이상의 표본에 대해 최상의 추정기입니다.

Bias and variance estimators

\(H_1\)의 편향(bias)과 분산에 대한 1차 근사는 다음과 같습니다:

\(\quad\)\(\begin{align}
\operatorname{bias}\left[ H_1 \right] &= \frac{H C_v}{n} \\
\operatorname{Var}\left[ H_1 \right] &= \frac{H^2 C_v}{n}
\end{align}\)

여기서 \(C_v\)는 변동 계수입니다.

유사하게 \(H_3\)의 편향과 분산에 대한 1차 근사는 다음입니다:

\(\quad\)\(\begin{align}
\frac{H \log_e \left(1 + C_v\right)}{2n} \left[ 1 + \frac{1 + C_v^2}{2} \right] \\
\frac{H \log_e \left(1 + C_v\right)}{n} \left[ 1 + \frac{1 + C_v^2}{4} \right]
\end{align}\)

수치적 실험에서, \(H_3\)은 일반적으로 \(H_1\)보다 조화 평균의 우수한 추정기입니다. \(H_2\)는 \(H_1\)과 대체로 유사한 추정치를 생성합니다.

External links

저작자표시 비영리 변경금지

Dawoum

(번역) Harmonic mean

Definition

Relationship with other means