원문 보기: https://dawoum.duckdns.org/wiki/Computer_data_storage
컴퓨터 데이터 저장 또는 디지털 데이터 저장은 디지털 데이터를 보관하기 위해 사용되는 컴퓨터 구성 요소와 기록 매체로 구성된 기술입니다. 그것은 컴퓨터의 핵심 기능이자 토대적 구성 요소입니다.
컴퓨터의 중앙 처리 장치 (CPU)는 계산을 수행함으로써 데이터를 조작하는 것입니다. 실제로, 거의 모든 컴퓨터는 저장 계층을 사용하며, 이는 빠르지만 비싸고 작은 저장 옵션을 CPU에 가깝게 배치하고, 느리지만 저렴하고 더 큰 옵션을 더 멀리 배치합니다. 일반적으로, 빠른 기술은 "메모리"라고 참조되고, 반면에 느린 지속형 기술은 "스토리지"이라고 참조됩니다.
심지어 최초의 컴퓨터 설계, 찰스 배비지의 분석 엔진과 퍼시 러드게이트의 분석 기계조차도 처리와 메모리를 명확히 구분했습니다 (배비지는 숫자를 기어의 회전으로 저장하고, 반면에 러드게이트는 숫자를 셔틀의 막대의 변위로 저장했습니다). 이 구분은 폰 노이만 아키텍처에서 확장되었는데, 여기서 CPU는 두 가지 주요 부분으로 구성됩니다: 제어 장치와 산술 논리 장치 (ALU). 전자는 CPU와 메모리 사이의 데이터 흐름을 제어하고, 반면에 후자는 데이터에 대한 산술 연산과 논리 연산을 수행합니다.
Functionality
상당한 양의 메모리 없이, 컴퓨터는 단지 고정된 연산을 수행하고 결과를 즉시 출력할 수 있을 뿐입니다. 그것은 동작을 변경하기 위해 재구성되어야 합니다. 이것은 데스크 계산기, 디지털 신호 프로세서, 및 기타 특수 장치와 같은 장치에 허용됩니다. 폰 노이만 기계는 작동 지침과 데이터를 저장하는 메모리를 가진다는 점에서 다릅니다. 그러한 컴퓨터는 새 프로그램마다 하드웨어를 재구성할 필요가 없고, 새 메모리 내 지침으로 간단히 재프로그래밍할 수 있다는 점에서 더 다재다능합니다; 그것들은 역시 설계하기 위해 더 간단한 경향이 있으며, 설계에서 상대적으로 간단한 프로세서가 복잡한 절차적 결과를 구축하기 위해 연속적인 계산 사이에 상태를 유지할 수 있습니다. 대부분의 최신 컴퓨터는 폰 노이만 기계입니다.
Data organization and representation
현대의 디지털 컴퓨터는 이진 숫자-표시 시스템을 사용하여 데이터를 표현합니다. 텍스트, 숫자, 그림, 오디오, 및 거의 임의의 형태의 정보는 비트 문자열 또는 이진 숫자로 변환될 수 있으며, 각각은 0 또는 1의 값을 가집니다. 가장 공통적인 저장 단위는 8비트와 같은 바이트입니다. 정보의 조각은 임의의 컴퓨터 또는 장치에 의해 처릳될 수 있으며, 그것의 저장 공간은 정보의 조각의 이진수 표현, 또는 단순히 데이터를 수용할 만큼 큽니다. 예를 들어, 인쇄된 약 1250페이지 분량의 셰익스피어 전집은 문자당 1바이트로 약 5메가바이트 (4천만 비트)에 저장될 수 있습니다.
데이터는 각 문자, 자릿수, 또는 멀티미디어 대상에 비트 패턴을 할당함으로써 인코딩됩니다. 인코딩을 위한 많은 표준이 존재합니다 (예를 들어, ASCII와 같은 문자 인코딩, JPEG와 같은 이미지 인코딩, 및 MPEG-4와 같은 비디오 인코딩).
각 인코딩된 단위에 비트를 추가함으로써, 중복성은 컴퓨터에게 코딩된 데이터에서 오류를 감지하고 수학적 알고리즘을 기바능로 그것들을 수정할 수 있도록 허용합니다. 오류는 일반적으로 무작위 비트 값 반전, 또는 "물리적 비트 피로", 구별 가능한 값 (0 또는 1)을 유지하는 스토리지의 물리적 비트의 손실, 또는 컴퓨터-사이 또는 컴퓨터 내 통신의 오류로 인해 낮은 확률로 발생합니다. 무작위 비트 반전 (예를 들어, 무작위 방사선으로 인해)은 전형적으로 감지 시 수정됩니다. 오작동하는 물리적 비트의 비트 또는 그룹 (특정 결함 비트는 항상 알 수 있는 것은 아닙니다; 그룹 정의는 특정 저장 장치에 따라 다름)은 전형적으로 자동으로 펜스 아웃되어, 장치에 의해 사용 중지되고 장치에서 작동하는 다른 동등한 그룹으로 교체되며, 여기서 수정된 비트 값이 복원됩니다 (가능하다면). 순환 중복 검사 (CRC) 방법은 전형적으로 통신과 저장에서 오류 감지에 사용됩니다. 그런 다음 감지된 오류는 다시 시도됩니다.
데이터 압축 방법은 많은 경우 (예를 들어, 데이터베이스) 비트 문자열을 더 짧은 비트 문자열로 표현 ("압축")하고 필요할 때 원래 문자열을 재구성 ("압축 해제")하도록 허용합니다. 이는 더 많은 계산 (필요할 때 압축 및 압축 해제)을 희생하여 많은 유형의 데이터에 대해 훨씬 적은 저장 공간 (수십 퍼센트)을 활용합니다. 저장 비용 절감과 관련 계산 비용 및 데이터 가용성의 가능한 지연 사이의 상충 관계에 대한 분석은 특정 데이터를 압축 상태로 유지할지 여부를 결정하기 전에 수행됩니다.
보안상의 이유로, 특정 유형의 데이터 (예를 들어, 신용카드 정보)는 저장 스냅샷 청크에서 승인되지 않은 정보 재구성 가능성을 방지하기 위해 스토리지에 암호화되어 보관될 수 있습니다.
Hierarchy of storage
일반적으로, 스토리지가 계층 구조에서 낮을수록, 대역폭이 적고 CPU에서 접근 지연 시간이 길어집니다. 스토리지를 1차, 이차, 삼차, 및 오프-라인 스토리지로 나누는 이러한 전통적인 구분도 비트당 비용에 따라 결정됩니다.
현대적 용법에서, 메모리는 보통 빠르지만 일시적인 반도체 읽기-쓰기 메모리, 전형적으로 DRAM (동적 RAM) 또는 이와 유사한 다른 장치입니다. 스토리지는 CPU에 의해 직접 접근될 수 없는 저장 장치와 해당 미디어 (이차 또는 삼차 스토리지), 전형적으로 하드 디스크 드라이브, 광 디스크 드라이브, 및 RAM보다 느리지만 비-휘발성 (전원이 꺼져도 내용을 유지)인 다른 장치로 구성됩니다.[2]
역사적으로, 메모리는, 기술에 의존하여, 중앙 메모리, 코어 메모리, 코어 스토리지, 드럼, 주요 메모리, 실제 스토리지, 또는 내부 메모리라고 불렸습니다. 한편, 더 느린 영구 스토리지 장치는 이차 스토리지, 외부 메모리, 또는 보조/주변 스토리지라고 불렸습니다.
Primary storage
주요 스토리지 (메인 메모리, 내부 메모리, 또는 프라임 메모리라고도 알려져 있음)는, 종종 간단히 메모리라고 참조되며, CPU에서 직접 접근할 수 있는 유일한 스토리지입니다. CPU는 거기에 저장된 명령어를 지속적으로 읽고 필요에 따라 실행합니다. 적극적으로 작동하는 임의의 데이터도 균등한 방식으로 거기에 저장됩니다.
역사적으로, 초기 컴퓨터는 지연 회선, 윌리엄스 튜브, 또는 회전 자기 드럼을 주요 스토리지로 사용했습니다. 1954년까지, 그들 신뢰할 수 없는 방법은 대부분 자기-코어 메모리로 대체되었습니다. 코어 메모리는 1970년대까지 지배적으로 남아있었고, 그 당시에 통합 회로 기술에서 발전으로 반도체 메모리가 경제적으로 경쟁력을 갖추게 되었습니다.
이것은 현대의 무작위-접근 메모리 (RAM)로 이어졌습니다. 그것은 작은-크기에 가볍지만, 동시에 매우 비쌉니다. 주요 스토리지에 대해 사용된 특정 유형의 RAM은 휘발성이 있어, 전원이 공급되지 않으면 정보가 손실됩니다. 열린 프로그램을 저장하는 것 외에도, 그것은 디스크 캐시와 쓰기 버퍼 역할을 하여 읽기와 쓰기 성능을 모두 개선합니다. 운영 시스템은 소프트웨어를 실행함으로써 필요하지 않은 한 캐싱을 위해 RAM 용량을 빌립니다. 여분의 메모리는 임시적으로 고속 데이터 저장을 위한 RAM 드라이브로 활용될 수 있습니다.
다이어그램에 표시된 것처럼, 전통적인 주요 대용량 RAM 외에도 주요 스토리지에 두 개보다 많은 하위-계층이 있습니다:
- 프로세서 레지스터는 프로세서 내부에 위치해 있습니다. 각 레지스터는 전형적으로 데이터의 단어 (종종 32비트 또는 64비트)를 보관합니다. CPU 명령어는 산술 논리 장치에 이 데이터 (또는 이 데이터의 도움을 받아)에 대한 다양한 계산 또는 기타 연산을 수행하도록 지시합니다. 레지스터는 모든 형태의 컴퓨터 데이터 스토리지 중에서 가장 빠릅니다.
- 프로세서 캐시는 초고속 레지스터와 훨씬 느린 주요 메모리 사이의 중간 단계입니다. 그것은 오로지 컴퓨터 성능을 개선하기 위해 도입되었습니다. 주요 메모리에서 가장 활발하게 사용되는 정보는 캐시 메모리에 복제되며, 이는 더 빠르지만 용량은 훨씬 적습니다. 다른 한편, 주요 메모리는 훨씬 느리지만, 프로세서 레지스터보다 훨씬 더 큰 저장 용량을 가지고 있습니다. 다중-수준 계층적 캐시 설정도 공통적으로 사용됩니다—주요 캐시는 가장 작고, 가장 빠르고 프로세서 내부에 위치합니다; 이차 캐시는 다소 크고 느립니다.
주요 메모리는 메모리 버스를 통해 중앙 처리 장치에 직접 또는 간접적으로 연결됩니다. 그것은 실제로 두 개의 버스 (다이어그램에는 없음)가 있습니다: 주소 버스와 데이터 버스입니다. CPU는 먼저 주소 버스를 통해 숫자를 보내며, 이 숫자는 메모리 주소라고 하며, 원하는 데이터 위치를 나타냅니다. 그런-다음 그것은 데이터 버스를 사용하여 메모리 셀에서 데이터를 읽거나 씁니다. 추가적으로, 메모리 관리 장치 (MMU)는 CPU와 RAM 사이의 작은 장치로, 실제 메모리 주소를 다시 계산하여 예를 들어 가상 메모리나 다른 작업의 추상화를 제공합니다.
주요 스토리지에 사용되는 RAM 유형은 휘발성 (시작 시 초기화되지 않음)이므로, 그러한 스토리지만 포함하는 컴퓨터는 컴퓨터를 시작하기 위해 명령어를 읽을 소스가 없습니다. 따라서, 작은 시작 프로그램 (BIOS)을 포함하는 비-휘발성 주요 스토리지는 컴퓨터를 부트스트랩하기 위해 사용됩니다. 즉, 비휘발성 이차 스토리지에서 더 큰 프로그램을 RAM으로 읽어 실행을 시작합니다. 이 목적을 위해 사용되는 비-휘발성 기술은 ROM (읽기-전용 메모리)이라고 합니다 (대부분 ROM 유형도 무작위 접근이 가능하므로 용어가 다소 혼란스러울 수 있습니다).
많은 유형의 "ROM"은 문자 그대로 읽기-전용이 아니며, 그것들에 대해 업데이트가 가능합니다; 어쨌든, 그것들은 느리고 메모리는 대량으로 지워야 다시 쓸 수 있습니다. 일부 임베디드 시스템은 그러한 프로그램이 거의 변경되지 않기 때문에 ROM (또는 유사한 것)에서 직접 프로그램을 실행합니다. 표준 컴퓨터는 비-기본 프로그램을 ROM에 저장하지 않고, 오히려, 비-휘발성이고 비용이 덜 드는 대용량의 이차 스토리지를 사용합니다.
최근에, 일부 용도에서 주요 스토리자와 이차 스토리지는 각각 역사적으로 이차 스토리지와 삼차 스토리지라고 불리던 것을 말합니다.
ROM, EEPROM, NOR flash, 및 RAM을 포함한 주요 스토리지는 보통 바이트-주소 지정이 가능합니다.
Secondary storage
이차 스토리지 (외부 메모리 또는 보조 스토리지라고도 알려져 있음)는 CPU에 의해 직접 액세스할 수 없다는 점에서 주요 스토리지와 다릅니다. 컴퓨터는 보통 입력/출력 채널을 사용하여 보조 스토리지에 접근하고 원하는 데이터를 주요 스토리지로 전송합니다. 이차 스토리지는 비-휘발성 (전원이 꺼져도 데이터를 유지)입니다. 최신 컴퓨터 시스템은 전형적으로 이차 스토리지가 저렴하기 때문에 주요 스토리지보다 이차 스토리지가 두 자릿수 더 많습니다.
현대 컴퓨터에서, 하드 디스크 드라이브 (HDD) 또는 솔리드-스테이트 드라이브 (SSD)가 보통 이차 스토리지로 사용됩니다. HDD 또는 SSD에 대해 바이트당 접근 시간은 전형적으로 밀리초 (천분의 일초)로 측정되고, 반면에 주요 스토리지에 대한 바이트당 접근 시간은 나노초 (십억분의 일초)로 측정됩니다. 따라서, 이차 스토리지는 주요 스토리지보다 상당히 느립니다. CD 드라이브와 DVD 드라이브와 같은 회전 광 스토리지 장치는 접근 시간이 더 깁니다. 이차 스토리지 기술의 다른 예로는 USB 플래시 드라이브, 플로피 디스크, 자기 테이프, 종이 테이프, 천공 카드, 및 RAM 디스크가 있습니다.
HDD의 디스크 읽기/쓰기 헤드가 적절한 배치와 데이터에 도달하면, 트랙의 후속 데이터에 매우 빠르게 접근할 수 있습니다. 탐색 시간과 회전 지연 시간을 줄이기 위해, 데이터는 큰 연속 블록으로 디스크와 주고받습니다. 디스크의 순차적 또는 블록 접근은 임의 접근보다 훨씬 빠르고, 순차적 및 블록 접근을 기반으로 효율적인 알고리즘을 설계하기 위해 많은 정교한 패러다임이 개발되어 왔습니다. I/O 병목 현상을 줄이는 또 다른 방법은 여러 디스크를 병렬로 사용하여 주요 메모리와 이차 메모리 사이의 대역폭을 늘리는 것입니다.
이차 스토리지는 종종 파일 시스템 형식에 따라 포맷되며, 이는 데이터를 파일과 디렉토리로 구성하기 위해 필요한 추상화를 제공하는 동시에 특정 파일 소유자, 접근 시간, 접근 권한, 및 기타 정보를 설명하는 메타데이터를 제공합니다.
대부분의 컴퓨터 운영 시스템은 가상 메모리 개념을 사용하여, 시스템에서 물리적으로 사용할 수 있는 것보다 더 많은 주요 스토리지 용량을 활용할 수 있습니다. 주요 메모리가 채워질 때, 시스템은 가장 적게 사용되는 청크 (페이지)를 이차 스토리지의 스왑 파일이나 페이지 파일로 이동하고 나중에 필요할 때 검색합니다. 많은 페이지가 느린 이차 스토리지로 이동되면 시스템 성능이 저하됩니다.
HDD, ODD, 및 SSD를 포함한 이차 스토리지는 보통 블록-주소 지정이 가능합니다.
Tertiary storage
삼차 스토리지 또는 삼차 메모리는 이차 스토리지보다 낮은 수준입니다. 전형적으로, 그것은 시스템의 요구에 따라 이동식 대용량 저장 매체를 스토리지 장치에 마운트 (삽입)하고 마운트 해제하는 로봇 메커니즘을 포함합니다; 그러한 데이터는 종종 사용 전에 이차 스토리지에 복사됩니다. 그것은 이차 스토리지보다 훨씬 느리기 때문에 (예를 들처, 5–60초 대 1–10밀리초) 주로 거의 접근되지 않는 정보를 보관하는 데 사용됩니다. 이것은 주로 인간 작업자 없이 접근되는 매우 큰 데이터 스토리지에 유용합니다. 전형적인 예로는 테이프 라이브러리와 광 주크박스가 있습니다.
컴퓨터가 삼차 스토리지에서 정보를 읽어야 할 때, 먼저 카탈로그 데이터베이스를 참조하여 어떤 테이프나 디스크에 정보가 들어 있는지 확인합니다. 다음으로, 컴퓨터는 로봇 팔에 미디어를 가져와 드라이브에 넣으라고 지시합니다. 컴퓨터가 정보 읽기를 마쳤을 때, 로봇 팔은 미디어를 라이브러리의 원래 위치로 되돌립니다.
삼차 스토리지는 "온라인에 가깝기" 때문에 니어라인 스토리지라고도 합니다. 온라인, 니어라인, 및 오프라인 스토리지 사이의 형식적인 구분은 다음과 같습니다:
- 온라인 스토리지는 I/O에 즉시 사용할 수 있습니다.
- 니어라인 스토리지는 즉시 사용할 수 없지만, 인간의 개입 없이 신속하게 온라인으로 만들 수 있습니다.
- 오프라인 스토리지는 즉시 사용할 수는 없고, 온라인 상태로 전환하려면 인간의 개입이 필요합니다.
예를 들어, 항상 켜진 회전식 하드 디스크 드라이브는 온라인 스토리지이고, 반면에 유휴 디스크의 거대한 배열 (MAID)과 같이 자동으로 회전이 감소하는 회전식 드라이브는 니어라인 스토리지입니다. 테이프 라이브러리와 같이 자동으로 로드할 수 있는 테이프 카트리지와 같은 이동식 미디어는 니어라인 스토리지이고, 수동으로 로드해야 하는 테이프 카트리지는 오프라인 스토리지입니다.
Off-line storage
오프-라인 스토리지는 처리 장치의 제어를 받지 않는 매체 또는 장치 위에 컴퓨터 데이터 스토리지입니다. 매체는 보통 이차 또는 삼차 스토리지 장치에 기록되고, 그런-다음 물리적으로 제거되거나 연결이 끊어집니다. 그것은 컴퓨터가 다시 접근하기 전에 인간 작업자에 의해 삽입되거나 연결되어야 합니다. 삼차 스토리지와 달리, 그것은 인간의 상호 작용 없이는 접근할 수 없습니다.
오프-라인 스토리지는 분리된 매체를 물리적으로 쉽게 운반할 수 있기 때문에 정보를 전송하기 위해 사용됩니다. 추가적으로, 그것은 재해의 경우에 대해 유용하며, 여기서, 예를 들어, 화재는 원래 데이터가 파괴되며, 원격 위치에 있는 매체는 영향을 받지 않을 것이고, 재해 복구가 가능합니다. 오프-라인 스토리지는 컴퓨터에서 물리적으로 접근할 수 없고, 데이터 기밀성 또는 무결성이 컴퓨터-기반 공격 기술에 의해 영향을 받지 않으므로 일반적인 정보 보안이 향상됩니다. 역시, 보관 목적으로 저장된 정보에 거의 접근하지 않으면, 오프-라인 스토리지는 삼차 스토리지보다 비용이 적게 듭니다.
현대의 개인용 컴퓨터에서, 대부분의 이차 스토리지와 삼차 스트로지 매체가 오프-라인 스토리지에도 사용됩니다. 광 디스크와 플래시 메모리 장치가 가장 인기가 많고, 이동식 하드 디스크 드라이브는 훨씬 덜 인기가 있습니다; 오래된 예로는 플로피 디스크와 Zip 디스크가 있습니다. 엔터프라이즈 사용에서, 자기 테이프 카트리지가 우세합니다; 오래된 예로는 오픈-릴 자기 테이프와 천공 카드가 있습니다.
Characteristics of storage
스토리지 계층의 모든 레벨에서 스토리지 기술은 특정 핵심 특성을 평가하고 특정 구현에 대한 특성을 측정하여 차별화할 수 있습니다. 이들 핵심 특성은 변동성, 가변성, 접근성, 및 주소 지정 가능성입니다. 임의의 스토리지 기술의 임의의 특정 구현에 대해, 측정할 가치가 있는 특성은 용량과 성능입니다.
Volatility
비-휘발성 메모리는 지속적으로 전력을 공급받지 않더라도 저장된 정보를 유지합니다. 그것은 정보의 장-기간 저장에 대해 적합합니다. 휘발성 메모리는 저장된 정보를 유지하기 위해 지속적인 전력이 필요합니다. 가장 빠른 메모리 기술은 휘발성이지만, 이는 보편적인 규칙은 아닙니다. 주요 스토리지는 매우 빨라야 하므로, 그것은 주로 휘발성 메모리를 사용합니다.
동적 무작위-접근 메모리는 저장된 정보를 주기적으로 다시 읽고 다시 쓰거나, 새로 고쳐야 하는 휘발성 메모리의 한 형태이며, 그렇지 않으면 그것은 사라집니다. 정적 무작위-접근 메모리는 DRAM과 비슷한 휘발성 메모리의 한 형태이지만 전원이 공급되는 한 새로 고칠 필요가 없습니다; 그것은 전원 공급이 끊어질 때 내용이 손실됩니다.
무정전 전원 공급 장치 (UPS)는 배터리가 고갈되기 전에 컴퓨터에 기본 휘발성 스토리지에서 비휘발성 스토리지로 정보를 옮길 수 있는 짧은 시간을 제공하기 위해 사용될 수 있습니다. 예를 들어 EMC Symmetrix와 같은 일부 시스템에는 휘발성 스토리지를 몇 분 동안 유지하는 통합 배터리가 있습니다.
Mutability
Read/write storage or mutable storage : 언제든지 정보를 덮어쓸 수 있습니다. 주요 스토리지 목적으로 어느 정도의 읽기/쓰기 스토리지 없이 컴퓨터는 많은 작업에 대해 쓸모가 없습니다. 최신 컴퓨터는 전형적으로 이차 스토리지에도 읽기/쓰기 스토리지를 사용합니다.
Slow write, fast read storage : 정보를 여러 번 덮어쓸 수 있는 읽기/쓰기 스토리지이지만 쓰기 작업은 읽기 작업보다 훨씬 느립니다. 예로는 CD-RW와 SSD가 있습니다.
Write once storage : 한 번 쓰고 여러 번 읽기 (WORM)는 제조 후 어느 시점에서 정보를 한 번만 쓸 수 있게 해줍니다. 예로는 반도체 프로그래밍 가능 읽기 전용 메모리와 CD-R이 있습니다.
Read only storage : 제조 당시 저장된 정보를 유지합니다. 예로는 마스크 ROM IC 및 CD-ROM이 있습니다.
Accessibility
Random access : 스토리지에서 임의의 위치는 거의 같은 시간 내에 언제든지 접근할 수 있습니다. 그러한 특성은 주요 스토리지와 이차 스토리지에 적합합니다. 대부분의 반도체 메모리, 플래시 메모리, 및 하드 디스크 드라이브는 무작위 접근을 제공하지만, 반도체와 플래시 메모리는 모두 하드 디스크 드라이브에 비해 대기 시간이 최소인데, 왜냐하면 기계 부품을 움직일 필요가 없기 때문입니다.
Sequential access : 정보의 조각의 접근은 순차적으로, 하나씩 이루어집니다; 그러므로 특정 정보의 조각에 접근하는 데 걸리는 시간은 마지막으로 접근했던 정보의 조각에 따라 달라집니다. 그러한 특성은 오프라인 스토리지의 전형입니다.
Addressability
Location-addressable : 스토리지에서 각각의 개별적으로 접근 가능한 정보 단위는 숫자 메모리 주소로 선택됩니다. 현대 컴퓨터에서, 위치-주소 지정 가능한 스토리지는 보통의 컴퓨터 프로그램에 의해 내부적으로 접근되는 주요 스토리지로 제한되는데, 왜냐하면 위치-주소 지정 가능성은 매우 효율적이지만, 인간에게는 부담스럽기 때문입니다.
File addressable : 정보는 가변 길이의 파일로 나뉘고, 특정 파일은 사람이 읽을 수 있는 디렉토리와 파일 이름으로 선택됩니다. 놓여있는 장치는 여전히 위치-주소 지정 가능이지만, 컴퓨터의 운영 시스템은 연산을 더 이해하기 쉽게 만들기 위해 파일 시스템 추상화를 제공합니다. 최신 컴퓨터에서, 이차, 삼차, 및 오프-라인 스토리지가 파일 시스템을 사용합니다.
Content-addressable : 각각의 개별적으로 접근 가능한 정보 단위는 거기에 저장된 내용(의 일부)을 기준으로 선택됩니다. 컨텐츠-주소 지정 가능 스토리지는 소프트웨어 (컴퓨터 프로그램) 또는 하드웨어 (컴퓨터 장치)를 사용하여 구현할 수 있으며, 하드웨어는 더 빠르지만 더 비싼 옵션입니다. 하드웨어 컨텐츠 주소 지정 가능 메모리는 종종 컴퓨터의 CPU 캐시에서 사용됩니다.
Capacity
Raw capacity : 스토리지 장치 또는 매체가 보관할 수 있는 총 정보량입니다. 그것은 비트 또는 바이트 (예를 들어, 10.4 메가바이트)의 양으로 표현됩니다.
Memory storage density : 저장된 정보의 압축성. 그것은 길이, 넓이, 또는 부피의 단위로 나눈 매체의 저장 용량입니다 (예를 들어, 제곱 인치당 1.2 메가바이트).
Performance
Latency : 스토리지에서 특정 위치에 접근하는 데 걸리는 시간입니다. 관련 측정의 단위는 전형적으로 주요 스토리지에 대해 나노초, 이차 스토리지에 대해 밀리초, 및 삼차 스토리지에 대해 초입니다. 그것은 읽기 대기 시간과 쓰기 대기 시간 (특히 비휘발성 메모리의 경우)을 분리하는 것이 합리적일 수 있고, 순차 접근 스토리지에 대해 최소, 최대, 및 평균 대기 시간입니다.
Throughput : 정보를 스토리지에서 읽거나 스토리지에 쓸 수 있는 율입니다. 컴퓨터 데이터 스토리지에서, 처리량은 보통 초당 메가바이트 (MB/s)의 관점에서 표현되지만, 비트 전송률도 사용될 수 있습니다. 지연 시간과 마찬가지로, 읽기 율와 쓰기 율을 차별화해야 할 수 있습니다. 역시 무작위가 아닌 순차적으로 미디어에 접근하는 것은 전형적으로 최대 처리량이 생성됩니다.
Granularity : 추가적인 지연 시간을 발생시키지 않고도 단일 단위로 효율적으로 접근할 수 있는 가장 큰 데이터 "덩어리"의 크기입니다.
Reliability : 다양한 조건에서 자발적으로 비트 값이 변경될 확률, 즉 전체적인 실패율입니다.
hdparm 및 sar와 같은 유틸리티는 리눅스에서 IO 성능을 측정하기 위해 사용될 수 있습니다.
Energy use
- 팬 사용을 줄이는 스토리지 장치는 비활성 시 자동으로 종료되고, 저전력 하드 드라이브는 에너지 소비를 90%까지 줄일 수 있습니다.
- 2.5-인치 하드 디스크 드라이브는 종종 대용량 하드 디스크 드라이브보다 전력을 적게 소모합니다. 저용량 솔리드-스테이트 드라이브에는 움직이는 부품이 없고 하드 디스크보다 전력을 적게 소모합니다. 역시, 메모리는 하드 디스크보다 더 많은 전력을 소모할 수 있습니다. 메모리 벽에 부딪히는 것을 피하기 위해 사용되는 대용량 캐시도 많은 양의 전력을 소모할 수 있습니다.
Security
전체 디스크 암호화, 볼륨 및 가상 디스크 암호화, 및/또는 파일/폴더 암호화는 대부분의 저장 장치에 대해 손쉽게 사용될 수 있습니다.
하드웨어 메모리 암호화는 인텔 아키텍처에서 사용 가능하며, 전체 메모리 암호화 (TME) 및 여러 키를 갖는 페이지 과립 메모리 암화화 (MKTME)를 지원하고, 2015년 10월 이후 SPARC M7 세대에서 사용 가능합니다.
Vulnerability and reliability
데이터 스토리지의 구별되는 유형은 다른 장애의 지점을 가지고 예측 장애 분석 방법도 다양합니다.
즉시 총 손실로 이어질 수 있는 취약점으로는 기계식 하드 드라이브의 헤드 충돌과 플래시 스토리지의 전자 부품의 고장이 있습니다.
Error detection
작동 시간과 스핀업 횟수를 포함하는 S.M.A.R.T. 진단 데이터를 사용하여 하드 디스크 드라이브의 임박한 오류를 예측할 수 있지만 그 신뢰성에 대해서는 논란이 있습니다.
플래시 스토리지는 오류가 누적되어 전송률이 저하될 수 있으며, 플래시 메모리 컨트롤러는 이를 수정하려고 시도합니다.
광 미디어의 건강 상태는 수정 가능한 사소한 오류를 측정함으로써 결정될 수 있으며, 이 중 많은 수는 미디어가 열화되거나 품질이 낮음을 나타냅니다. 연속적인 사소한 오류가 너무 많으면 데이터가 손상될 수 있습니다. 모든 공급업체와 광 드라이브 모델이 오류 스캐닝을 지원하지는 않습니다.
Storage media
2011년 기준, 가장 공통적으로 사용되는 데이터 스토리지 매체는 반도체, 자기, 및 광 매체이고, 반면에 종이는 여전히 제한적으로 사용되고 있습니다. 올-플래시 어레이 (AFA)와 같은 다른 몇 가지 토대 스토리지 기술이 개발을 위해 제안되었습니다.
Semiconductor
반도체 메모리는 반도체-기반 집적 회로 (IC) 칩을 정보를 저장하기 위해 사용합니다. 데이터는 전형적으로 금속-산화물-반도체 (MOS) 메모리 셀에 저장됩니다. 반도체 메모리 칩에는 수백만 개의 메모리 셀이 포함될 수 있으며, 이는 작은 MOS 필드-효과 트랜지스터 (MOSFET) 및/또는 MOS 커패시터로 구성됩니다. 휘발성 및 비휘발성 형태의 반도체 메모리가 모두 존재하며, 전자는 표준 MOSFET을 사용하고 후자는 플로팅-게이트 MOSFET을 사용합니다.
현대 컴퓨터에서, 주요 스토리지는 거의 전적으로 동적 휘발성 반도체 무작위-접근 메모리 (RAM), 특히 동적 무작위-접근 메모리 (DRAM)로 구성됩니다. 세기가 바뀌면서, 플래시 메모리로 알려진 비-휘발성 플로팅-게이트 반도체 메모리 유형이 가정용 컴퓨터에 대해 오프-라인 스토리지로 꾸준히 점유율을 늘려왔습니다. 비-휘발성 반도체 메모리는 다양한 고급 전자 장치와 이를 위해 설계된 특수 컴퓨터의 이차 스토리지로도 사용됩니다.
2006년 초반 기준, 노트북과 데스크탑 컴퓨터 제조업체는 보다 전통적인 HDD 대신 또는 이에 추가하여 이차 스토리지에 대해 기본 구성 옵션으로 플래시-기반 솔리드-스테이트 드라이브 (SSD)를 사용하기 시작했습니다.
Magnetic
자기 스토리지는 정보를 저장하기 위해 자기적으로 코팅된 표면에 다양한 자화 패턴을 사용합니다. 자기 스토리지는 비-휘발성입니다. 정보는 하나 이상의 기록 변환기를 포함할 수 있는 하나 이상의 읽기/쓰기 헤드를 사용하여 접근됩니다. 읽기/쓰기 헤드는 헤드나 매체 또는 둘 다가 데이터를 접근하기 위해 또 다른 매체에 상대적으로 이동되도록 표면의 일부만 덮습니다. 최신 컴퓨터에서, 자기 스토리지는 다음과 같은 형태를 취합니다:
- 자기 디스크;
- 플로피 디스크, 오프-라인 스토리지에 대해 사용됩니다;
- 하드 디스크 드라이브, 이차 스토리지에 대해 사용됩니다.
- 자기 테이프, 삼차 스토피지와 오프-라인 스토리지에 대해 사용됩니다;
- 회전형 메모리 (자석 롤).
초기 컴퓨터에서, 자기 스토리지는 다음과 같은 용도로도 사용되었습니다:
- 자기 메모리, 또는 코어 메모리, 코어 로프 메모리, 씬-필름 메모리 및/또는 트위스터 메모리 형태에서 주요 스토리지.
- 자기 카드 형태에서 삼차 스토리지 (예를 들어, NCR CRAM) 또는 오프-라인 저장;
- 그 당시에는 자기 테이프가 종종 이차 스토리지로 사용되었습니다.
자기 스토리지는 플래시 스토리지와 재기록-가능 광학 미디어와 같이 재기록 주기에 대한 명확한 한계가 없는데, 왜냐하면 자기 필드는 물리적 마모를 발생하지 않기 때문입니다. 오히려, 수명은 기계적 부품에 의해 제한됩니다.
Optical
전형적인 광 디스크, 광 스토리지는 원형 디스크 표면의 변형에 정보를 저장하고 레이저 다이오드로 표면을 조명하고 반사를 관찰함으로써 이 정보를 읽습니다. 광 디스크 스토리지는 비-휘발성입니다. 변형은 영구적 (읽기-전용 미디어), 한 번만 형성 (한 번 쓰기 미디어), 또는 되돌릴 수 있습니다 (기록-가능 또는 읽기/쓰기 미디어). 2009년 기준, 공통적으로 사용되는 형태는 다음과 같습니다:
- CD, CD-ROM, DVD, BD-ROM: 일기-전용 스토리지, 대량의 디지털 정보 (음악, 비디오, 컴퓨터 프로그램)를 배포하는 데 사용됩니다;
- CD-R, DVD-R, DVD+R, BD-R: 한 번 쓰기 스토리지, 삼차 스토리지 및 오프-라인 스토리지에 대해 사용됩니다;
- CD-RW, DVD-RW, DVD+RW, DVD-RAM, BD-RE: 느린 쓰기, 빠른 읽기 스토리지, 삼차 스토리지 및 오프-라인 스토리지에 대해 사용됩니다;
- Ultra Density Optical 또는 UDO: 용량에서 BD-R 또는 BD-RE와 비슷하고 느린 쓰기, 빠른 읽기 스토리지, 삼차 스토리지 및 오프-라인 스토리지에 대해 사용됩니다;
자기-광 디스크 스토리지는 강자성 표면의 자기 상태가 정보를 저장하는 광 디스크 스토리지입니다. 정보는 광학적으로 읽고 자기와 광학 방법을 결합함으로써 씁니다. 자기-광 디스크 스토리지는 삼차 스토리지와 오프-라인 스토리지에 사용되는 비-휘발성, 순차 접근, 느린 쓰기, 빠른 읽기 스토리지입니다.
3D 광 데이터 스토리지도 제안되어 왔습니다.
자기 광전도체에서의 광 유도 자화 용융은 역시 고속 저에너지 소비 자기-광 스토리지를 위해 제안되어 왔습니다.
Paper
종이 데이터 스토리지는, 전형적으로 종이 테이프나 천공 카드 형태로, 특히 일반적인-목적 컴퓨터가 존재하기 전에 자동 처리를 위한 정보를 저장하기 위해 오랫동안 사용되어 왔습니다. 정보는 종이 또는 판지 매체에 구멍을 뚫어 기록되었고, 특정 매체의 위치가 단단한지 또는 구멍이 있는지 확인하기 위해 기계적으로 (또는 나중에 광학적으로) 읽혔습니다. 바코드는 판매되거나 운송되는 물건에 컴퓨터로 읽을 수 있는 정보를 안전하게 부착하도록 만듭니다.
(다른 디지털 데이터 스토리지와 비교하여) 상대적으로 적은 양의 디지털 데이터는 장기 스토리지를 위해 매트릭스 바코드로 종이에 백업될 수 있는데, 왜냐하면 종이의 수명은 전형적으로 자기 데이터 스토리지보다 더 길기 때문입니다.
Other storage media or substrates
Vacuum-tube memory : 윌리엄스 튜브는 음극선관을 사용했고, 셀렉트론 튜브는 대형 진공관을 정보를 저장하기위해 사용했습니다. 이들 주요 스토리지는 윌리엄스 튜브가 신뢰할 수 없었고, 셀렉트론 튜브가 비쌌기 때문에 시장에서 오래가지 못했습니다.
Electro-acoustic memory : 지연선 메모리는 정보를 저장하기 위해 수은과 같은 물질에 음파를 사용했습니다. 지연선 메모리는 동적 휘발성, 순환 순차적 읽기/쓰기 스토리지였고, 주요 스토리지에 대해 사용되었습니다.
Optical tape : 광학 저장 매체로, 일반적으로 길고 좁은 플라스틱 띠로 구성되어, 패턴을 쓰고 패턴을 다시 읽을 수 있습니다. 그것은 영화 필름 스톡 및 광 디스크와 일부 기술을 공유하지만, 어느 것과도 호환되지 않습니다. 이 기술을 개발하는 동기는 자기 테이프나 광 디스크보다 훨씬 더 큰 저장 용량이 가능하다는 것이었습니다.
Phase-change memory : 위상-변화 물질의 다양한 기계적 위상을 X–Y 주소 지정 가능 매트릭스에 정보를 저장하고 물질의 다양한 전기 저항을 관찰함으로써 정보를 읽기 위해 사용합니다. 위상-변화 메모리는 비-휘발성, 무작위 접근 읽기/쓰기 스토리지이고, 주요, 이차, 및 오프-라인 스토리지에 대해 사용될 수 있습니다. 대부분의 재기록 가능 및 많은 쓰기-한 번 광 디스크는 이미 위상-변화 물질을 정보를 저장하기 위해 사용합니다.
Holographic data storage : 크리스탈 또는 광중합체 내부에 광학적으로 정보를 저장합니다. 홀로그램 스토리지는 소수의 표면 층으로 제한되는 광 디스크 스토리지와 달리 스토리지 매체의 전체 볼륨을 활용할 수 있습니다. 홀로그램 스토리지는 비-휘발성, 순차-접근, 및 한 번-쓰기 또는 읽기/쓰기 스토리지입니다. 그것은 이차 및 오프-라인 스토리지에 사용될 수 있습니다. 홀로그램 다용도 디스크 (HVD)를 참조하십시오.
Molecular memory : 전하를 저장할 수 있는 폴리머에 정보를 저장합니다. 분자 메모리는 특히 주요 스토리지에 적합할 수 있습니다. 분자 메모리의 이론적인 저장 용량은 제곱인치당 10테라비트 (16 Gbit/mm2)입니다.
Magnetic photoconductors : 낮은 조명으로 수정될 수 있는 자기 정보를 저장합니다.
DNA : DNA 뉴클레오티드에 정보를 저장합니다. 그것은 2012년에 처음 이루어졌으며, 연구자들은 DNA 1g당 1.28 페타바이트의 비율을 달성했습니다. 2017년 3월에, 과학자들은 DNA 분수라는 새로운 알고리즘이 DNA 1g당 215 페타바이트로 이론적 한계의 85%를 달성했다고 보고했습니다.
Related technologies
Redundancy
비트 오작동 그룹은 오류 감지와 수정 메커니즘 (위 참조)에 의해 해결될 수 있지만, 스토리지 장치 오작동에는 다른 해결책이 필요합니다. 다음 해결책은 공통적으로 사용되고 대부분의 스토리지 장치에 대해 유효합니다:
- 장치 미러링 (복제) – 이 문제에 대한 공통적인 해결책은 또 다른 장치 (전형적으로 같은 유형)에 동일한 장치 컨텐츠 사본을 지속적으로 유지하는 것입니다. 단점은 스토리지가 두 배가 되고, 두 장치 (사본)가 동시에 업데이트되어야 하고 약간의 오버헤드와 약간의 지연이 발생할 수 있다는 것입니다. 장점은 두 개의 독립적인 프로세스에 의해 같은 데이터 그룹을 동시에 읽을 수 있어, 성능이 향상된다는 것입니다. 복제된 장치 중 하나에 결함이 있는 것으로 감지될 때, 다른 사본은 여전히 작동하고 또 다른 장치에서 새 사본을 생성하기 위해 사용됩니다 (보통 이 목적을 위해 대기 장치 풀에서 작동 가능합니다).
- 독립 디스크의 중복 배열 (RAID) – 이 방법은 장치 그룹에서 하나의 장치가 실패하고 복원된 컨텐츠로 교체되도록 허용함으로써 위의 장치 미러링을 일반화합니다 (장치 미러링은 n=2를 갖는 RAID입니다). n=5 또는 n=6의 RAID 그룹이 공통적입니다. n>2는 n=2와 비교했을 때 스토리지를 절약하지만, 정규 연산 (종종 성능이 저하됨)과 결함이 있는 장치 교체 중에 더 많은 처리가 필요합니다.
장치 미러링과 전형적인 RAID는 장치의 RAID 그룹에서 단일 장치 장애를 처리하도록 설계되었습니다. 어쨌든, RAID 그룹이 첫 번째 장애에서 완전히 복구되기 전에 두 번째 장애가 발생하면, 데이터가 손실될 수 있습니다. 단일 장애의 확률은 전형적으로 작습니다. 따라서 시간 근접성에서 같은 RAID 그룹에서 두 번 장애가 발생할 확률은 훨씬 작습니다 (근사적으로 확률 제곱, 즉 그 자체를 곱합니다). 데이터베이스가 이렇게 작은 데이터 손실 확률조차 허용할 수 없으면, RAID 그룹 자체가 복제 (미러링)됩니다. 많은 경우에서, 그러한 미러링은 재해에서 복구를 처리하기 위해 다른 스토리지 어레이에서 지리적으로 원격으로 수행됩니다 (위의 재해 복구 참조).
Network connectivity
이차 또는 삼차 스토리지는 컴퓨터 네트워크를 활용하여 컴퓨터에 연결할 수 있습니다. 이 개념은 여러 프로세서 사이에 덜 공유되는 주요 스토리지에는 적용되지 않습니다.
- 직접-연결 스토리지 (DAS)는 임의의 네트워크를 사용하지 않는 전통적인 대용량 스토리지입니다. 이것은 여전히 가장 인기 있는 접근 방식입니다. 이 회고적 용어는 NAS 및 SAN과 함께 최근에 만들어졌습니다.
- 네트워크-연결 스토리지 (NAS)는 지역 영역 네트워크, 개인 광역 네트워크, 또는 온라인 파일 스토리지의 경우에서, 인터넷을 통해 또 다른 컴퓨터가 파일 수준에서 접근할 수 있는 컴퓨터에 연결된 대용량 스토리지입니다. NAS는 공통적으로 NFS 및 CIFS/SMB 프로토콜과 결합됩니다.
- 스토리지 영역 네트워크 (SAN)는 다른 컴퓨터에 저장 용량을 제공하는 특수 네트워크입니다. NAS와 SAN 사이의 중요한 차이점은 NAS가 클라이언트 컴퓨터에 파일 시스템을 제공하고 관리하고, 반면에 SAN은 블록-주소 지정 (원시) 수준에서 접근을 제공하여, 제공된 용량 내에서 데이터 또는 파일 시스템을 관리하기 위한 시스템을 연결한다는 것입니다. SAN은 공통적으로 파이버 채널 네트워크와 결합됩니다.
Robotic storage
대량의 개별 자기 테이프와 광 디스크 또는 자기-광 디스크는 로봇 삼차 스토리지 장치에 저장될 수 있습니다. 테이프 스토리지 분야에서, 그것들은 테이프 라이브러리라고 알려져 있고, 광 스토리지 분야에서 광 주크박스, 또는 비유적으로 광 디스크 라이브러리라고 합니다. 두 기술 중 하나의 드라이브 장치만 포함하는 가장 작은 형태는 자동-로더 또는 자동-체인저라고 참조됩니다.
로봇-접근 스토리지 장치에는 여러 개의 슬롯이 있을 수 있으며, 각각 개별 미디어를 보관하고, 보통 슬롯을 가로질러 내장 드라이브에 미디어를 로드하는 하나 이상의 피킹 로봇이 있습니다. 슬롯과 피킹 장치의 배열은 성능에 영향을 미칩니다. 그러한 스토리지의 중요한 특징은 슬롯, 모듈, 드라이브, 로봇을 추가하는 확장 옵션입니다. 테이프 라이브러리는 10개에서 100,000개 이상의 슬롯을 가질 수 있고, 테라바이트 또는 페타바이트의 니어-라인 정보를 제공합니다. 광 주크박스는 최대 1,000개의 슬롯을 가진 다소 작은 솔루션입니다.
로봇 스토리지는 백업과 영상, 의료 및 비디오 산업의 대용량 아카이브에 사용됩니다. 계층적 스토리지 관리는 오랫동안 사용하지 않은 파일을 빠른 하드 디스크 스토리지에서 라이브러리나 주크박스로 자동으로 마이그레이션하는 가장 잘 알려진 아카이빙 전략입니다. 만약 파일이 필요하다면, 그것들은 디스크로 다시 검색됩니다.
Further reading
- Goda, K.; Kitsuregawa, M. (2012). "The history of storage systems". Proceedings of the IEEE. 100: 1433–1440. doi:10.1109/JPROC.2012.2189787.
- Memory & storage, Computer history museum