일련의 측정에서, 정확도(accuracy)는 특정 값에 대한 측정의 근접성이고, 정밀도(precision)는 서로에 대한 측정의 근접성입니다.
정확도는 두 정의를 가집니다:
- 보다 공통적으로, 그것은 시스템적 오차(systematic errors), 통계적 편향(statistical bias)의 측정의 설명입니다; 낮은 정확도는 결과와 "참" 값 사이에 차이의 원인이 됩니다. ISO는 이것을 진실성(trueness)이라고 부릅니다.
- 대안적으로, ISO는 위의 관찰 오차(observational error)의 유형 둘 다 (무작위 및 시스템적)의 조합을 설명하는 것으로 정확도를 정의하므로, 높은 정확도는 높은 정밀도와 높은 진실성 둘 다를 요구합니다.
정밀도는 무작위 오차(random errors), 통계적 변동가능성(statistical variability)의 측정의 설명입니다.
더 간단한 용어에서, 같은 양의 반복된 측정으로부터 데이터 점의 집합이 주어지면, 그 집합은 만약 그것들의 평균이 측정 중인 양의 참 값에 가까우면 정확하다고 말해질 수 있지만, 그 집합은 만약 그 값이 서로 가까우면, 정밀하다고 말해질 수 있습니다. 위의 "정확도"의 첫 번째, 보다 공통적인 정의에서, 두 개념은 서로 독립적이므로, 특정 데이터의 집합은 정확, 또는 정밀, 또는 둘 다, 또는 둘 다 아님이라고 말해질 수 있습니다.
Common technical definition
과학(science)과 공학(engineering) 분야에서, 측정(measurement) 시스템의 정확도는 해당 양의 참 값(value)에 대한 양(quantity) 측정의 근접성의 정도입니다. 재현성(reproducibility) 및 반복성(repeatability)과 관련된 측정 시스템의 정밀도는 변경되지 않은 조건 아래에서 반복된 측정이 같은 결과(result)를 보이는 정도입니다. 비록 단어 정밀도와 정확도가 구어체(colloquial) 사용에서 동의어(synonymous)일 수 있지만, 그것들은 과학적 방법(scientific method)의 문맥에서 의도적으로 대조됩니다.
측정의 해석이 중심적인 역할을 하는, 통계학의 분야는 정확도와 정밀도 대신에 용어 편향(bias)과 변동가능성(variability)을 사용하는 것을 선호합니다: 편향은 부정확도의 총양이고 변동가능성은 부정확도의 총양입니다.
측정 시스템은 정확하지만 정밀하지는 않을 수 있거나, 정밀하지만 정확하지 않을 수 있거나, 둘 다 아닐 수 있거나 둘 다일 수도 있습니다. 예를 들어, 만약 실험이 시스템적 오차(systematic error)를 포함하면, 표본 크기(sample size)를 증가시키는 것은 일반적으로 정밀도를 증가시키지만 정확도를 개선하지는 않습니다. 결과는 결함이 있는 실험에서 일관되지만 부정확한 결과가 될 것입니다. 시스템적 오차를 제거하는 것은 정확도를 향상시키지만 정밀도를 변경하지는 않습니다.
측정 시스템이 만약 그것이 정확과 정밀 둘 다하면 유효한 것으로 여겨집니다. 관련된 용어는 편향 (독립 변수(independent variable)와 관련이 없는 요인 또는 요인들에 의해 유발되는 비-무작위(random) 또는 방향화된 효과) 및 오차 (무작위 변동가능성)를 포함합니다.
그 용어는 역시 간접 측정–즉, 관찰된 데이터에서 계산 절차를 통해 얻어진 값에 적용됩니다.
정확도와 정밀도 외에도, 측정은 역시 측정 해상도(measurement resolution)를 가질 수 있으며, 이것은 측정에서 응답을 생성하는 놓여-있는 물리량의 가장 작은 변화입니다.
수치 해석학(numerical analysis)에서, 정확도는 역시 참 값에 대한 계산의 근접성입니다; 반면에 정밀도는 전형적으로 십진 또는 이진 자릿수의 숫자에 의해 정의되는 표현의 해상도입니다.
군사적 용어에서, 정확도는 주로 사격의 정확도 (justesse de tir)를 참조하며, 사격의 정밀도는 표적의 중심과 그 주변에서 사격 그룹의 근접성에 의해 표현됩니다.
Quantification
산업용 기기에서, 정확도는 측정 공차, 또는 기기의 전송이고 기기가 정상적인 작동 조건에서 사용될 때 만들어지는 오차의 한계를 정의합니다.
이상적으로 측정 장치는 정확 및 정밀 둘 다하고, 측정 모두는 참 값에 가깝고 밀접하게 떼를 짓게 됩니다. 측정 과정의 정확도와 정밀도는 보통 일부 추적-가능한(traceable) 참조 표준(standard)을 반복적으로 측정함으로써 설립된니다. 그러한 표준은 국제 단위 시스템(International System of Units) (프랑스어: Système international d'unités로부터 축약된 SI)에 정의되고 미국에서 국립 표준과 기술 연구소(National Institute of Standards and Technology)와 같은 국가 표준 기관(standards organization)에서 유지 관리합니다.
이것은 역시 측정이 반복되고 평균될 때 적용됩니다. 그 경우에서, 용어 표준 오차(standard error)는 적절하게 적용됩니다: 평균의 정밀도는 평균 측정 횟수의 제곱근으로 나뉜 공정의 알려진 표준 편차와 같습니다. 게다가, 중심 극한 정리(central limit theorem)는 평균화된 측정의 확률 분포(probability distribution)가 개별적인 측정의 확률 분포보다 정규 분포에 더 가까울 것이라는 것을 보여줍니다.
정확도과 관련하여 우리는 다음을 구별할 수 있습니다:
- 측정의 평균(mean)과 참조 값 사이의 차이, 편향(bias). 편향에 대해 설립과 교정하는 것은 보정(calibration)에 대해 요구됩니다.
- 정확도와 정밀도의 결합된 효과.
과학과 공학에서 공통 관례는 유효 숫자(significant figures)를 수단으로 정확성 및/또는 정밀도를 암시적으로 표현하는 것입니다. 명시적으로 언급되지 않을 때, 오차의 한계는 마지막 중요한 위치의 절-반 값으로 이해됩니다. 예를 들어, 843.6 m, 또는 843.0 m, 또는 800.0 m의 기록은 0.05 m의 한계 (마지막 중요한 위치는 10분의 1 위치)를 의미하지만, 843 m의 기록은 0.5 m의 오차의 한계를 의미합니다 (마지막 유효 자릿수는 단위입니다).
후행하는 영들을 갖고 십진 점이 없는, 8,000 m의 판독 값은 모호합니다; 후행하는 영들은 유효 숫자로 의도되거나 의도되지 않을 수 있습니다. 이 모호성을 피하기 위해, 숫자는 과학적 표기법으로 나타낼 수 있습니다: \(8.0 \times 10^3\) m는 첫 번째 영이 유효한 것 (따라서 50 m의 한계)을 나타내지만, \(8.000 \times 10^3\) m는 모든 셋의 영들이 유효한 것이며, 0.5 m의 한계를 제공함을 나타냅니다. 유사하게, 우리는 기본 측정 단위의 배수를 사용할 수 있습니다: 8.0 km는 \(8.0 \times 10^3\) m에 동등합니다. 그것은 0.05 km (50 m)의 한계를 나타냅니다. 어쨌든, 이 관례에 대한 의존은 그것을 준수하지 않는 출처에서 데이터를 받을 때 거짓 정밀도(false precision) 오차로 이어집니다. 예를 들어, 153,753과 같은 숫자를 정밀도 +/- 5,000과 함께 보고하는 출처는 그것을 정밀도 +/- 0.5를 가지는 것처럼 보입니다. 관례 아래에서 그것은 154,000으로 반올림되었을 것입니다.
대안적으로, 과학적 문맥에서, 만약 오차의 한계를 보다 정밀도와 함께 나타내기를 희망하면, 우리는 \(7.54398(23) \times 10^{-10}\) m와 같은 표기법을 사용할 수 있으며, 7.54375에서 \(7.54421 \times 10^{-10}\) m 사이의 범위를 의미합니다.
정밀도는 다음을 포함합니다:
- 반복성(repeatability) – 모든 노력이 같은 기기와 연산자를 사용하고, 짧은 시간 동안 반복함으로써 조건을 일정하게 유지하기 위해 만들어질 때 발생하는 변동; 및
- 재현성(reproducibility) – 다른 기기와 연산자 사이에 같은 측정 과정을 사용하고, 더 긴 기간에 걸쳐 발생하는 변동.
ISO definition (ISO 5725)
이들 용어의 의미에서 변화가 1994년에 ISO 5725 일련의 표준의 발표와 함께 나타났으며, 이것은 역시 2008년 "BIPM International Vocabulary of Metrology" (VIM), 항목 2.13과 2.14의 2008 문제에서 반영되었습니다.
ISO 5725-1에 따르면, 일반적인 용어 "정확도"는 참 값에 대한 측정 값의 근접성을 설명하기 위해 사용됩니다. 그 용어가 동일한 측정물질(measurand)의 측정의 집합에 적용될 때, 그것은 무작위 오차의 성분과 시스템적 오차의 성분을 포함합니다. 이 경우에서, 진실성은 실제 (참) 값에 대한 측정 결과의 집합의 평균의 근접성이고 정밀도는 결과의 집합 사이에 일치의 근접성입니다.
ISO 5725-1 및 VIM은 역시 이전에 BS 5497-1에 지정된 용어 "편향(bias)"의 사용을 피하는데, 왜냐하면 그것은, 의학과 법률에서 처럼, 과학과 공학의 분야 밖에서 다른 의미를 가지기 때문입니다.
In binary classification
정확도는 역시 이진 분류(binary classification) 테스트가 조건을 올바르게 식별하거나 제외하는 정도의 통계적 측정으로 사용됩니다. 즉, 정확도는 조사된 전체 경우의 숫자 사이에 올바른 예측 (참 양성(true positive)과 참 음성(true negative) 둘 다)의 비율입니다. 의미론으로 문맥을 명확하게 만들기 위해, 그것은 종종 "무작위 정확도"또는 "무작위 인덱스(Rand index)"로 참조됩니다. 그것의 테스트의 매개변수입니다. 이진 정확도를 정량화하는 공식은 다음입니다:
\(\quad\)Accuracy = (TP + TN)/(TP + TN + FP + FN)
여기서: TP = 참 양성; FP = 거짓 양성; TN = 참 음성; FN = 거짓 음성
이 문맥에서, ISO 5725-1에 의해 정의된 진실성과 정밀도의 개념은 적용되지 않음을 주목하십시오. 한 가지 이유는 양의 단일 "참 값"이 아니지만, 모든 각 경우에 대해 오히려 두 가능한 참 값이 있지만, 정확도는 모든 경우에 걸쳐 평균이고 따라서 두 값을 모두 고려하는 것입니다. 어쨌든, 그 용어 정밀도(precision)는 이 문맥에서 정보 검색의 분야로부터 비롯된 다른 메트릭을 의미하기 위해 사용됩니다 (아래를 참조하십시오).
In psychometrics and psychophysics
심리측정학(psychometrics)과 심리물리학(psychophysics)에서, 용어 정확도는 타당성(validity)과 상수 오차(constant error)와 교환-가능하게 사용됩니다. 정밀도는 신뢰성(reliability)과 변수 오차(variable error)에 대해 동의어입니다. 측정 기기 또는 심리적 테스트의 타당성은 실험 또는 행동과의 상관-관계를 통해 설립됩니다. 신뢰성은 전통적으로 크론바흐의 알파(Cronbach's alpha)와 같은 내부 일관성 테스트를 통해 관련된 응답을 가지는 관련된 질문의 집합을 보장하고, 그런-다음 참조와 대상 모집단 사이에 그것들의 관련된 질문을 비교하기 위해, 다양한 통계 기법으로 설립됩니다.
In logic simulation
논리 모의실험(logic simulation)에서, 정확한 모델의 평가에서 공통적인 실수는 논리 모의실험 모델(logic simulation model)을 트랜지스터(transistor) 회로 모의실험 모델(circuit simulation model)과 비교하는 것입니다. 이것은 정확도가 아니라 정밀도에서 차이의 비교입니다. 정밀도는 세부 묘사에 관해 측정되고 정확도는 현실성에 관해 측정됩니다.
In information systems
데이터베이스(database)와 웹 검색 엔진(web search engine)과 같은, 정보 검색 시스템은 많은 다른 메트릭(many different metrics)에 의해 평가되며, 그것 중 일부는, 결과를 참 양성 (올바르게 검색된 문서), 참 음성 (올바르지 않게 검색된 문서), 거짓 양성 (올바르지 않게 검색된) 및 거짓 음성 (올바르지 않게 검색되지 않은 문서)으로 나누는 혼동 행렬(confusion matrix)에서 유도됩니다. 공통적으로 사용되는 메트릭은 정밀도와 재현율(precision and recall)의 개념을 포함합니다. 이 문맥에서, 정밀도는 사람에 의해 선택된 일련의 근거 참값(ground truth) 관련 결과를 사용하여, 쿼리와 관련된 검색된 문서의 분수 (참 양성을 참+거짓 양성으로 나눈 값)로 정의됩니다. 재현율은 관련 문서의 전체 숫자와 비교하여 검색된 관련 문서의 분수 (참 양성을 참 양성+거짓 음성으로 나눈 값)로 정의됩니다. 덜 공통적으로, 정확도의 메트릭이 사용되며, 정확한 분류 (참 양성 더하기 참 음성)의 전체 숫자를 전체 문서의 숫자로 나눈 값으로 정의됩니다.
이들 메트릭의 어느 것도 결과의 순위를 고려하지 않습니다. 순위는 웹 검색 엔진에 대해 매우 중요한데, 왜냐하면 독자는 결과의 첫 페이지를 지나치는 경우는 드물고, 웹에 문서가 너무 많아서 특정 검색에 포함할지 제외할지 여부를 수동으로 분류할 수 없기 때문입니다. 특정 숫자의 결과에 컷오프를 더하는 것은 순위를 어느 정도 고려합니다. k에서 측정 정밀도는, 예를 들어, 오직 상위 10개 (k=10) 검색 결과를 보는 정밀도의 측정입니다. 가치를-줄인 누적 이득(discounted cumulative gain)과 같은 보다 정교한 메트릭은 각 개별 순위를 고려하고, 이것이 중요한 곳에서 보다 공통적으로 사용됩니다.
External links
- BIPM - Guides in metrology, Guide to the Expression of Uncertainty in Measurement (GUM) and International Vocabulary of Metrology (VIM)
- "Beyond NIST Traceability: What really creates accuracy", Controlled Environments magazine
- Precision and Accuracy with Three Psychophysical Methods
- Appendix D.1: Terminology, Guidelines for Evaluating and Expressing the Uncertainty of NIST Measurement Results
- Accuracy and Precision
- Accuracy vs Precision — a brief video by Matt Parker
- What's the difference between accuracy and precision? by Matt Anticole at TED-Ed
- Precision and Accuracy exam study guide