* 전체 APM 시스템의 UTF-8 설정하기 *



종래에는 홈페이지가 자국인들만 이용할 것을 예상하고 제작하므로써 외국인 즉, 비한글 사용자들에 대한 서비스를 미쳐 염두에 두지 못하므로써 한글이 ?????$%^&( 처럼 깨져 보이는 무지함을 보였던 것이 사실입니다.


이제는 홈페이지 제작도 유니코드(UTF-8) 인코딩 방식이 세계적 추세이며 이러한 추세에 맞추어 MySql도 기본언어를 utf8(UTF-8 인코딩) 방식으로 변경하였으므로, 홈페이지를 종래 euc-kr 등 한글로만 표기하던 방식도 UTF-8 인코딩 방식으로 업데이트해야 할 때 입니다. UTF-8 인코딩 방식은 한국어, 일어, 중국어, 태국어, 아랍어 등 만국어 표기가 가능한 방식입니다.

APM에서 UTF-8을 구현하려면 꽤 많은 부분을 수정해야 합니다 .
다음은 APM에서 UTF-8 구현 방법과 소스코드를 첨부합니다.


원본 저자 아래 환경에서 적용 테스트 .
----------------
OS : WinXP SP2
Apache : httpd-2.0.52
PHP : php-5.0.3
MySQL : mysql-4.1.11  
----------------

wono77 같은 방식으로, 아래 환경에서 적용 테스트 성공.(글추가 2006년 5월 24일)

-----------------------------
OS : Linux Redhat 9.0
Apache : httpd-2.0.52-3

PHP : php-5.1.2
MySQL : mysql-5.1.7-beta

-----------------------------

1. apache 환경파일 편집 (httpd.conf)
2. php 환경파일 편집 (php.ini)
3. mysql 환경파일 편집 (my.cnf)
4. apache, mysql 서비스 재시작
5. mysql에서 캐릭터셋 확인 및 디비생성
6. php 소스코드에 mysql_query("set names utf8;"); 함수 추가
7. php 소스에 한글문자열이 있으면 파일저장할때 UTF-8 파일형식으로 저장
8. 웹브라우즈의 보기-인코딩-UTF-8로 선택

1. /etc/httpd/conf/httpd.conf 에서 캐릭터셋 수정
/*------------
AddDefaultCharset UTF-8

2. /etc/php.ini 에서 캐릭터셋 수정
/*------------
;default_charset = "iso-8859-1"
default_charset = "utf-8"

3. /etc/my.cnf 에서 캐릭터셋 수정
/*------------
[client]
#password = your_password
default-character-set=utf8

[mysqld]
init_connect=SET collation_connection = utf8_general_ci
init_connect=SET NAMES utf8
default-character-set=utf8
character-set-server=utf8
collation-server=utf8_general_ci

[mysql]
default-character-set=utf8

4. 환경변수를 모두 수정후 apache 및 mysql 서비스 재시작
/*------------

5. mysql에서 캐릭터셋 확인
/*------------
# mysql
Welcome to the MySQL monitor. Commands end with ; or \g.
Your MySQL connection id is 247 to server version: 4.1.10a

Type 'help;' or '\h' for help. Type '\c' to clear the buffer.

mysql> use test
Database changed
mysql> show variables like 'c%';
+---------+-----------+
| Variable_name | Value |
+---------+-----------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
| collation_connection | utf8_general_ci |
| collation_database | utf8_general_ci |
| collation_server | utf8_general_ci |
| concurrent_insert | ON |
| connect_timeout | 5 |
+---------+-----------+
12 rows in set (0.00 sec)

* MySql에서 데이터베이스 생성
mysql>CREATE DATABASE 디비명 DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;


--------------------------------------------------------------------------------------

* 추가(Putty 및 vi에서의 utf8설정) *

--------------------------------------------------------------------------------------

Putty 설정

설정에서 창>변환 을 선택한 다음, 수신한 데이터를 이 문자셋으로 가정이라고 되어 있는 박스에서 UTF-8을 선택한다.
이제 터미널에서는 보여지는 모든 문자셋을 UTF-8로 가정하게 된다.

쉘 설정

쉘 커맨드 라인에서 다음 명령을 실행한다.

export LANG="ko_KR.UTF-8"

로그인 될 때 항상 UTF-8을 사용하려면, 자신의 홈디렉토리의 .bashrc 파일에 위의 한 줄을 추가한다.
.bashrc 파일을 수정했을 경우,

source ~hayaloby/.bashrc

등의 명령을 내려서 곧바로 적용되게 할 수 있다.
이제 ls 등의 명령에서 리턴되는 값들을 비롯해서 쉘에서의 리턴문자열은 UTF-8로 표현된다.

vi 설정

이 상태에서

vi

를 입력해보면 글자가 깨져 보이게 된다.
vi 에디터의 인코딩을 설정해 주어야 하는데,
vi의 명령 중에 set을 이용해서 다음과 같이 설정할 수 있다.

set enc=UTF-8 set fenc=UTF-8 set tenc=UTF-8

enc는 vi에서 보여줄 때 사용되는 인코딩이고 tenc는 터미널에서 사용되는 인코딩이다. fenc는 수정하려는 파일의 인코딩이다.
항상 이렇게 작업을 하려면 홈디렉토리의 .vimrc 파일에 추가해 주면 된다.

파일 작업

이 상태에서 vi에디터로 작업하는 모든 파일은 UTF-8로 인코딩되어 저장된다.
'샾'을 입력해 보면 잘 입력됨을 확인할 수 있다.

확장완성형으로 돌아가기

  • Putty 설정
    수신한 데이터를 CP949로 받는다.
  • 쉘 설정
    export LANG="ko_KR.eucKR"
  • vi 설정
    set enc=euc-kr
    set fenc=euc-kr
    set tenc=euc-kr
    를 순서대로 설정해 준다.

---------------------------------------------------------------------------------------

기억해야할 사항:


mysql 5.x에서 utf-8이 아닌, utf8로 표시해야함을 기억합시다~(4.x에서는 utf-8이었음)

아파치, php에서는 utf-8 입니다.

php의 mysql connect 소스에서도 $dbconn->query("set names utf8")을 해줘야 함을 기억하자.


by wono77. 2006-05-10.


* 기존의 EUC-KR DB를 UTF-8로 변경하기  *

 

euc-kr에서 작성된 db를 백업해서 utf8에 넣을 생각인데..이건 조금더 해보고 글을 올리겠습니다.

(Test해봤는데 잘되네요~^^)


euc-kr로 작성된 db를 백업해서 utf8 db에 넣을때는..

mysqldump를 뜬후에, 덤프뜬 파일을 다음 스크립트를 통해 utf8로 변환해줍니다.


스크립트명: iconv.sh

---------------------------------

#!/bin/sh

iconv -feuc-kr -tutf-8 $1 > out.txt

rm -rf $1

mv out.txt $1
---------------------------------


즉 다음과 같이 해주시면 out라는 덤프가 utf8로 바뀝니다.

$mysqldump -uroot -p패스워드 디비명 > out

$iconv.sh out


그 후, 이 덤프를 utf8 시스템의 utf8 db에 넣어주시면 됩니다.^_^


by wono77. 2006-05-11.


* 기존의 EUC-KR 소스를 UTF-8로 변경하기  *


위의 iconv.sh 스크립트로 해당 소스를 하나씩 변경해주시면 됩니다.

전체 폴더의 소스 바꾸는 쉘스크립트는 아래와 같습니다.....=ㅂ=a;;;

(단, 이때 iconv가 적용안되는 문자셋에 대해 파일이 날아가므로,

iconv의 옵션 중 IGNORE가 필요합니다.

-IGNORE 옵션으로는 테스트 안해봄.

-실제 아래 전체 디렉토리 바꾸기에선 파일은 존재하지만,

중간 내용이 날아가는 문제 몇발생했음)


#!/bin/sh
for i in `ls $1`; do
    newname=`echo $i | tr "[A-Z]" "[a-z]"`
    iconv -feuc-kr -tutf-8 $1/$i > out.txt
    rm -rf $1/$i
    mv out.txt $1/$i
done

iconv -feuc-kr -tutf8//IGNORE


위의 파일 하나 바꾸기 iconv.sh는 아래와 같이 사용합니다.

$iconv.sh test.php


수작업으로 하다가 가끔, iconv에 없는 아스키가 나와서, 에러가 뜨면서, 원본 화일이 뻑나는 경우는 있으니, 백업 받아두고 하세요. 주의하시길....

10에 한개는 나옵니다. 소스가 엄청길거나..특수문자등에서...(해결방법이 업그레이드된 iconv의 기능 옵션으로 어떻게 하는거 같던데..직접 테스트는 해보지 않아서 잘 모르겠네요..)^^;


출처 : http://blog.naver.com/wono77/140024184001

참고사이트: http://database.sarang.net (알짜초보님)

+ Recent posts