[PHP]ひらがな・カタカナをローマ字に変換する

カタカナやひらがなをローマ字に変換するプログラムを作ってみました。
結構力技ですのでもう少し改良ができると思います。

<?php
mb_internal_encoding('utf-8');
$kana2romaji = new Kana2Romaji;

$str = "これは、ローマじへんかんのじっけんです";

$result = $kana2romaji->convert($str);
header("Content-type: text/html;charset=utf8");

echo $result;

class Kana2Romaji{
	function convert($str)
	{
		$str = mb_convert_kana($str, 'cHV', 'utf-8');

		$kana = array(
			'きゃ', 'きぃ', 'きゅ', 'きぇ', 'きょ',
			'ぎゃ', 'ぎぃ', 'ぎゅ', 'ぎぇ', 'ぎょ',
			'くぁ', 'くぃ', 'くぅ', 'くぇ', 'くぉ',
			'ぐぁ', 'ぐぃ', 'ぐぅ', 'ぐぇ', 'ぐぉ',
			'しゃ', 'しぃ', 'しゅ', 'しぇ', 'しょ',
			'じゃ', 'じぃ', 'じゅ', 'じぇ', 'じょ',
			'ちゃ', 'ちぃ', 'ちゅ', 'ちぇ', 'ちょ',
			'ぢゃ', 'ぢぃ', 'ぢゅ', 'ぢぇ', 'ぢょ',
			'つぁ', 'つぃ', 'つぇ', 'つぉ',
			'てゃ', 'てぃ', 'てゅ', 'てぇ', 'てょ',
			'でゃ', 'でぃ', 'でぅ', 'でぇ', 'でょ',
			'とぁ', 'とぃ', 'とぅ', 'とぇ', 'とぉ',
			'にゃ', 'にぃ', 'にゅ', 'にぇ', 'にょ',
			'ヴぁ', 'ヴぃ', 'ヴぇ', 'ヴぉ',
			'ひゃ', 'ひぃ', 'ひゅ', 'ひぇ', 'ひょ',
			'ふぁ', 'ふぃ', 'ふぇ', 'ふぉ',
			'ふゃ', 'ふゅ', 'ふょ',
			'びゃ', 'びぃ', 'びゅ', 'びぇ', 'びょ',
			'ヴゃ', 'ヴぃ', 'ヴゅ', 'ヴぇ', 'ヴょ',	
			'ぴゃ', 'ぴぃ', 'ぴゅ', 'ぴぇ', 'ぴょ',
			'みゃ', 'みぃ', 'みゅ', 'みぇ', 'みょ',	
			'りゃ', 'りぃ', 'りゅ', 'りぇ', 'りょ',
			'うぃ', 'うぇ', 'いぇ'
		);
		
		$romaji	 = array(
			'kya', 'kyi', 'kyu', 'kye', 'kyo',
			'gya', 'gyi', 'gyu', 'gye', 'gyo',
			'qwa', 'qwi', 'qwu', 'qwe', 'qwo',
			'gwa', 'gwi', 'gwu', 'gwe', 'gwo',
			'sya', 'syi', 'syu', 'sye', 'syo',
			'ja', 'jyi', 'ju', 'je', 'jo',
			'cha', 'cyi', 'chu', 'che', 'cho',
			'dya', 'dyi', 'dyu', 'dye', 'dyo',
			'tsa', 'tsi', 'tse', 'tso',
			'tha', 'ti', 'thu', 'the', 'tho',
			'dha', 'di', 'dhu', 'dhe', 'dho',
			'twa', 'twi', 'twu', 'twe', 'two',
			'nya', 'nyi', 'nyu', 'nye', 'nyo',
			'va', 'vi', 've', 'vo',
			'hya', 'hyi', 'hyu', 'hye', 'hyo',
			'fa', 'fi', 'fe', 'fo',
			'fya', 'fyu', 'fyo',
			'bya', 'byi', 'byu', 'bye', 'byo',
			'vya', 'vyi', 'vyu', 'vye', 'vyo',
			'pya', 'pyi', 'pyu', 'pye', 'pyo',
			'mya', 'myi', 'myu', 'mye', 'myo',
			'rya', 'ryi', 'ryu', 'rye', 'ryo',
			'wi', 'we', 'ye'
		);
		
		$str = $this->kana_replace($str, $kana, $romaji);

		$kana = array(
			'あ', 'い', 'う', 'え', 'お',
			'か', 'き', 'く', 'け', 'こ',
			'さ', 'し', 'す', 'せ', 'そ',
			'た', 'ち', 'つ', 'て', 'と',
			'な', 'に', 'ぬ', 'ね', 'の',
			'は', 'ひ', 'ふ', 'へ', 'ほ',
			'ま', 'み', 'む', 'め', 'も',
			'や', 'ゆ', 'よ',
			'ら', 'り', 'る', 'れ', 'ろ',
			'わ', 'ゐ', 'ゑ', 'を', 'ん',
			'が', 'ぎ', 'ぐ', 'げ', 'ご',
			'ざ', 'じ', 'ず', 'ぜ', 'ぞ',
			'だ', 'ぢ', 'づ', 'で', 'ど',
			'ば', 'び', 'ぶ', 'べ', 'ぼ',
			'ぱ', 'ぴ', 'ぷ', 'ぺ', 'ぽ'
		);
		
		$romaji = array(
			'a', 'i', 'u', 'e', 'o',
			'ka', 'ki', 'ku', 'ke', 'ko',
			'sa', 'shi', 'su', 'se', 'so',
			'ta', 'chi', 'tsu', 'te', 'to',
			'na', 'ni', 'nu', 'ne', 'no',
			'ha', 'hi', 'fu', 'he', 'ho',
			'ma', 'mi', 'mu', 'me', 'mo',
			'ya', 'yu', 'yo',
			'ra', 'ri', 'ru', 're', 'ro',
			'wa', 'wyi', 'wye', 'wo', 'n',
			'ga', 'gi', 'gu', 'ge', 'go',
			'za', 'ji', 'zu', 'ze', 'zo',
			'da', 'ji', 'du', 'de', 'do',
			'ba', 'bi', 'bu', 'be', 'bo',
			'pa', 'pi', 'pu', 'pe', 'po'
		);
		
		$str = $this->kana_replace($str, $kana, $romaji);
		
		$str = preg_replace('/(っ$|っ[^a-z])/u', "xtu", $str);
		$res = preg_match_all('/(っ)(.)/u', $str, $matches);
		if(!empty($res)){
			for($i=0;isset($matches[0][$i]);$i++){
				if($matches[0][$i] == 'っc') $matches[2][$i] = 't';
				$str = preg_replace('/' . $matches[1][$i] . '/u', $matches[2][$i], $str, 1);
			}
		}
		
		$kana = array(
			'ぁ', 'ぃ', 'ぅ', 'ぇ', 'ぉ',
			'ヵ', 'ヶ', 'っ', 'ゃ', 'ゅ', 'ょ', 'ゎ', '、', '。', ' '
		);
		
		$romaji = array(
			'a', 'i', 'u', 'e', 'o',
			'ka', 'ke', 'xtu', 'xya', 'xyu', 'xyo', 'xwa', ', ', '.', ' '
		);
		$str = $this->kana_replace($str, $kana, $romaji);
		
		$str = preg_replace('/^ー|[^a-z]ー/u', '', $str);
		$res = preg_match_all('/(.)(ー)/u', $str, $matches);

		if($res){
			for($i=0;isset($matches[0][$i]);$i++){
				if( $matches[1][$i] == "a" ){ $replace = 'â'; }
				else if( $matches[1][$i] == "i" ){ $replace = 'î'; }
				else if( $matches[1][$i] == "u" ){ $replace = 'û'; }
				else if( $matches[1][$i] == "e" ){ $replace = 'ê'; }
				else if( $matches[1][$i] == "o" ){ $replace = 'ô'; }
				else { $replace = ""; }
				
				$str = preg_replace('/' . $matches[0][$i] . '/u', $replace, $str, 1);
			}
		}
		
		return $str;
	}

	function kana_replace($str, $kana, $romaji)
	{
		$patterns = array();
		foreach($kana as $value){
			$patterns[] = '/' . $value . '/';
		}
		
		$str = preg_replace($patterns, $romaji, $str);
		return $str;
	}
}

結果:

koreha, rômajihenkannojikkendesu

今回「高速道路」などは「kosokudoro」とせずに「kousokudouro」と変換してあります。
ローマ字の表記は個人の判断によるところが多く、ここでは「じ」を「ji」、「ち」を「chi」にするなど、一部原則から外れています。
あくまで慣用的な書き方なので重要な場面では使用しないで下さい。

基本的な文字はカバーしているものの、「ぶゎ」「いぃ」など未対応のものは「buxwa」「ixi」のようになります。
必要に応じて「bwa」「yi」などを書き足してください。

人名などで、苗字と名前の頭文字を大文字にしたい場合は、標準関数 ucwords() を使えば簡単に出来ます。