1. 개요
�U+FFFD, REPLACEMENT CHARACTER
텍스트의 인코딩과 디코딩이 잘못됐을 때 생기는 것. Windows, macOS, Android에선 생김새는 마름모(◆)에 물음표(?)가 들어간 모습이다. 글꼴이나 운영체제에 따라, 대표적으로 iOS, 리눅스, 닌텐도 스위치에서는 마름모 대신 배경이 흰 사각형(□) 모양이 대신 표시되기도 한다. 또는 이 흰 사각형 안에 가위표 (X)가 들어가 있기도 하는데 이는 tofu라고 하며 주로 한자의 문자 깨짐 현상에서 나타난다. 나무위키에서도 네트워크 연결이 안 될때 □ 안에 (X)가 들어가며 문서 자체에는 문제가 없지만 검색하기 등의 UI에서 이렇게 깨지는 현상이 발생한다. 또한 Windows XP 등 옛 운영체제에선 물음표 없이 그냥 사각형만 등장한다. 모질라 파이어폭스에서는 이 글자 자체(U+FFFD)를 제외한 깨진 문자들을 회색 사각형 안에 회색 글씨로 16진수의 유니코드의 번호를 표시하는 식으로 표현한다.
2. 발생 원인
문서를 UTF-8로 저장하는 과정에서 이상이 있어 문서가 온전하게 저장되지 못하면 이렇게 된다. 문서를 UTF-8로 저장할 때, UTF-8에서 유효하지 않은 바이트나 byte sequence는 이 �로 대체된다. 따라서 이 문자는 정상적인 경우에는 절대 출력되지 않는다. 쉽게 말해 오류 문자.3. 기타
제대로 저장되지 못한 UTF-8 문서를 EUC-KR나 EUC-CN으로 읽으면 占쏙옙, 锟斤拷 등이 출력된다.유니코드에서만 사용되는 인코딩이기 때문에 EUC-KR(완성형)이나 EUC-CN(간체자), Shift_JIS(일본어) 등의 MBCS 인코딩이나, Windows-1252(서유럽어) 등의 ANSI 인코딩에서는 이 문자를 표시하거나 저장할 수 없으며, 따라서 물음표(?) 내지는 언더바(_)로 바뀌어서 표시되거나 저장된다.
단순히 폰트가 없어서 발생하는 tofu와는 다르다. tofu는 데이터가 깨지지 않고 온전히 보존되어 있어 환경만 바뀌면(글꼴 설치, 다른 컴퓨터 사용 등) 정상으로 돌아온다.