티스토리 뷰

윈도 메모장을 이용하여 html문서를 작성해보려고 합니다.
일단 메모장을 띄우신 후에
<html>
          <head>
                     <title></title>
          </head>
          <body>
          </body>
</html>



입력후에, 파일 - 다른이름으로 저장을 클릭합니다.

파일이름을 [원하는파일이름.html]로 해주시고, 파일형식을 모든 파일로 바꿔줍니다.
그리고 밑에 *인코딩부분이 ANSI로 되어있는데, 이것을 UTF-8로 바꿔주시고 저장합니다.

그리고 생성된 파일을 실행해주시면 자동으로 웹브라우저와 연결되 화면이 뜨게 됩니다.


*메모장에서 저장할때 나오는 인코딩이란?

메모장에서 저장할때 나오는 인코딩에는
ANSI
유니코드
유니코드(big endian)
UTF-8

이 있습니다.

문자인코딩을 알기 위해서는 일단 문자코드가 무엇잇지 알아야 하는데, 문자코드란 문자들을 나타내기위해서
그 문자들 하나하나와 임의로 정한 숫자들을 대응시켜논것을 말합니다.

문자인코딩이란 저렇게 대응되있는 문자코드를 컴퓨터가 이해할 수 있도록 변환하는 작업을 말합니다.

-유니코드
초창기 컴퓨터에는 ASCII코드라는 알파벳과 약간의 특수문자만이 포함되어 있는 코드를 문자셋으로 사용했는데요. 하지만 영어권이 아닌 다른나라에서는 자신의 나라의 문자를 컴퓨터로 표현을 해야만 햇습니다.
이렇게 각 나라마다 저마다의 코드를 독자적으로 개발하다보니 각 나라간의 문자코드들은 서로간의 호환성의 거의 없엇습니다. 따라서 각 문자코드를 통합하자는 취지에서 유니코드가 나오게 됩니다.

근데 메모장에서 보이는 유니코드(big endian) 라는것은 메모리 저장방식의 차이입니다.
보통 컴퓨터(intel x86)에서는 little endian 방식으로서 메모리에 하위바이트의 값이 메모리상에 먼저 표시되는 방법입니다. 반대로 big endian는 상위 바이트의 값이 메모리상에 먼저 표시되는 방법으로서 Sun이나 모토로라 계열의 CPU에서 사용되는 방법입니다.

-UTF-8
UTF-8은 유니코드입니다. ASCII코드와의 호환성을 목표로 개발된 문자코드로서, ASCII코드의 영역을 그대로 가지고 있습니다. 그외에 부분들을 표시해서 ASCII코드 외의 부분을 사용하는 방법입니다.

요즘 해외사이트들은 대부분 UTF-8을 사용합니다.
ASP.NET이나, 기타 대부분의 기본인코딩은 UTF-8을 사용합니다. 따라서 웹페이지의 한글컨텐츠가 UTF-8이외의 것으로 되어있는경우 인코딩이 깨지게 되는 현상이 일어나기도 합니다. 그러므로 표준화된 UTF-8을 쓰는것이 바람직합니다.


'Web Programing > HTML' 카테고리의 다른 글

메모장을 이용한 html의 시작.  (0) 2011.03.15
댓글
댓글쓰기 폼