📕컴퓨터의 정의
컴퓨터는 데이터를 처리하는 전자기기이고, 데이터(data)를 사람들에게 유용한 정보(information)로 변환한다.
- (raw) data : 처리가 되지 않은 data
- information : 정리된 자료
📗데이터 사이언스의 출발
1993년 유선 전화망의 디지털화 시작으로 데이터양이 급증했으며,
2000년대 가정마다 초고속 인터넷의 보급으로 디지털 데이터의 양이 급증했다.
따라서 그 방대한 데이터를 관리하고 사용할 방법을 모색하다가 -> 데이터 사이언스가 등장했다.
📗데이터 사이언스(Data Sceince)
데이터로부터 정제된 지식과 통찰을 추출해 내기 위해 과학적 방법론, 처리과정, 알고리즘, 시스템을 사용하는 학제 간 융합 분야
📗데이터 마이닝(광산에서 광석을 캐낸다는 어원)
수 많은 데이터로부터 필요한 정보를 추출함.
(데이터베이스, 통계학, 기계학습)을 이용
📗big data(빅 데이터)
전통적인 소프트웨어로는 분석하기 곤란할 정도로 크고 복잡한 데이터
📗컴퓨터가 데이터를 표현하는 방법
- Bits and bytes
- BIts는 바이너리 넘버로 구성된다.
- Bit는 스위치를 표현할수 있다.(on/off)
- Byte는 8bits이다.
- Byte는 하나의 문자를 나타낸다.
💡Daya Type
- 문자(text)
- 수(Number)
- 이미지
- 오디오
- 비디오
여러 형태의 데이터가 포함되는 경우 -> multi-media
📗Data and Computers
- 컴퓨터는 멀티미디어 장비이다. 다양한 카테고리의 정보를 다룰 수 있다.
- 컴퓨터는 저장, 표현 그리고 우리가 수정하게 끔 도울 수 있다.
- 숫자
- 문자
- 오디오
- 이미지와 그래픽
- 영상
- 모든 저장은 bits로 이루어진다.
- 즉 0/1의 2진수 형태로 자료를 저장한다.
💡데이터의 표현
📕Data and Computers
📗Data compression(자료 압축)
공간의 절약을 위해서 데이터의 조각들을 저장하고 대역폭을 전환할 필요성이 있다.
📗Compression ratio(압축률)
압축된 데이터의 크기를 원래 데이터의 크기로 나눈 비율
💡데이터 압축의 2가지 방법
- lossless(비손실)
- 데이터를 압축하더라도 원래의 데이터의 손실 없이 압축하는 방법
- lossy(손실)
- 데이터를 압축하는데 원래의 데이터의 손실이 발생하는 방법
- 너무 정교한 자료(고해상도 사진)- 정보가 손실되더라도 눈에 보이지 않는 정도로 손실을 일으킴.
- 일부러 정보의 손실을 발생시켜서 압축률을 높이는 경우도 있음.
💡ZIP
비손실 압축의 예
원래 데이터-> 압축된 데이터
비손실 압축이기 때문에 압축된 데이터를 정보의 손실 없이 복원할 수 있다.
💡JPEG
손실 압축의 예
원래 데이터-> 압축된 데이터
세밀한 데이터에 변형을 가함-> 압축률을 높임
인간의 눈으로 차이를 느끼지 못함.
📗Analog and Digital Information
- 컴퓨터는 유한하다
- 유한한 컴퓨터 환경에서 표현할 방법이 뭐가 있을까
정보는 두 가지 방식으로 표현할 수 있다.
- 아날로그 데이터
- 연속적인 데이터 형식
- 실제 데이터 형식과 유사하다
- 디지털 데이터
- 독립된 데이터 표현 방식
- 정보를 요소별로 쪼갠다
컴퓨터는 아날로그 데이터로 일을 처리할 수 없다.
따라서 우리는 아날로그 데이터를 디지털화해야 한다.
📗Digitize(디지털화)
데이터를 조각들로 쪼개고 그 조각들을 따로따로 표현해야 한다.
2진수로 디지털 데이터를 저장하는 이유는
- 컴퓨터 계산이 쉽고, 다른 진법으로 쉽게 변환할 수 있기 때문에
- 컴퓨터, 통신, 자료 저장 등에서 2진법이 제일 효율적이고, 안정적이다.
📗Electronic Signals
- 아날로그 신호는 지속적으로 변동한다. (up and down)
- 디지털 신호는 hight / low state를 가진다. 그것은 0과 1인 바이너리 digiti로 1대 1 대응 가능하다
- 모든 전기신호는 분해 가능하다
- 환경적 영향으로 신호의 전압은 변동할 수 있다.
디지털 신호는 원래의 모양을 복원하기 위해서 reclocked 된다.
전기적 신호는 신호를 보낼 당시에는 깔끔했지만 거리가 멀어질수록 신호에 불순물, 잡음이 생긴다.
아날로그의 데이터의 잡음이 생겼다면 복원하기가 굉장히 어렵지만
디지털 데이터는 잡음이 생기더라도 0과 1이라는 명확한 신호체계가 있기 때문에 복원이 쉽다.
따라서 컴퓨터를 사용할 때 analog 데이터보다 digital 데이터를 선호한다.
📗Binary Representations
n bit로 표현 가능한 경우 의 수는 2^N이다.
자연수 표현방법
- 2진수로 표현한다.
- 컴퓨터는 정해진 공간의 데이터를 사용하기 때문에 0을 2진수로 표현하면 0이지만 규격 된 size인 8bit에 맞추려면 00000000으로 적어야 한다.
- 이러한 개념을 leading zeroes라고 한다.
- 자연수가 표현 가능하다면 정수도 표현이 가능하다.
'학교 > 컴퓨터학개론' 카테고리의 다른 글
[컴퓨터학개론 9장]- Text & Audio (0) | 2022.07.03 |
---|---|
[컴퓨터학개론 8장]-Numerical data (0) | 2022.06.29 |
[컴퓨터학개론 6장]- binary number (0) | 2022.06.28 |
[컴퓨터학개론 5장]- PC Architecture (0) | 2022.06.28 |
[컴퓨터학개론 4장]- hardware & software (0) | 2022.06.27 |