2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

文字コード総合スレ part14

1 :デフォルトの名無しさん:2023/03/03(金) 15:46:58.08 ID:yKqwMGHT.net
Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
文字コード総合スレ part13
https://mevius.5ch.net/test/read.cgi/tech/1593777227/

953 :デフォルトの名無しさん:2024/07/23(火) 09:20:06.98 ID:iSDzXJU2.net
>UTF-8に統一
は可笑しい
UNICODEに統一してencodingをUTF-8にしろ

954 :デフォルトの名無しさん:2024/07/23(火) 15:46:26.54 ID:uXZC6JH8.net
>>945
たぶんSS3とX0212じゃない?とはいえテレビから降ってくる文字を変換するような事
しない人には永久に知らない世界な気がするけど。

955 :デフォルトの名無しさん:2024/07/23(火) 17:29:30.59 ID:TPPfHQM2.net
>>949
そもそもWindows 10の初期状態を知っている人間なんてほぼいない。

もう何年前のOSの話をしているのか?

956 :デフォルトの名無しさん:2024/07/23(火) 22:00:07.41 ID:ZwP44UoN.net
>>954
EUC-JP の仕様を知らずに書いてる人だったんですね。
まぁ今知らないのであれば、今さら知る必要はないとは思います。

957 :デフォルトの名無しさん:2024/07/25(木) 17:53:41.84 ID:d36Rq1nw.net
EUC-JPとSJISは漢字のマッピングが微妙に異なるからEUC-JPは使われなくなった。

958 :デフォルトの名無しさん:2024/07/26(金) 16:30:07.87 ID:s0039+ok.net
イマドキEUC-JPで話が通じるのはジジババだけ

959 :デフォルトの名無しさん:2024/07/26(金) 20:23:31.47 ID:JylNHC7t.net
変なおっさんがWindows 10からとしつこい

960 :デフォルトの名無しさん:2024/07/26(金) 23:58:48.57 ID:4nyZ3kl6.net
今もメールはISO-2022-JPが40年近く使われ続けているし
ここは文字コードスレだから
それとEUC-JPとシフトJISの三すくみの日本に
ユニコードが来て符号化はUTF8に統一されたといういきさつは知っておいてほしいかな

961 :デフォルトの名無しさん:2024/07/27(土) 00:18:06.34 ID:n/2U62/h.net
しつこい

962 :デフォルトの名無しさん:2024/07/27(土) 00:18:56.15 ID:n/2U62/h.net
Eメールの本文ファイルがUTF-8だろ

963 :デフォルトの名無しさん:2024/07/27(土) 00:26:59.78 ID:5C/e4754.net
プレーンテキストだと、まだISO-2022-JPは使われている

964 :デフォルトの名無しさん:2024/07/27(土) 02:31:46.73 ID:05H92w5k.net
EUC-JP が廃れたのはそれを使っていたUnix系が UTF-8 を採用し置き換えが進んだせい Linux は率先して UTF-8 化された SJIS は全く関係ない

メールに関してはメーラーやその設定によるけどJIS第二水準までの文字までしか使ってなければまだ ISO-2022-JP だがそれ以外の文字があると勝手に UTF-8 の切り替えるのが一般的になってる

965 :デフォルトの名無しさん:2024/07/27(土) 03:23:33.68 ID:Wmb0dG6/.net
そういや区点コードもほとんど使われんようになったな。

966 :デフォルトの名無しさん:2024/07/27(土) 14:20:48.28 ID:MpFjT9ff.net
EUC-JPと区点コードはほぼ同じ

967 :デフォルトの名無しさん:2024/07/27(土) 14:41:58.45 ID:05H92w5k.net
>>966
なんかのギャグ?

968 :デフォルトの名無しさん:2024/07/27(土) 15:18:28.80 ID:MpFjT9ff.net
ギャグついでに
馬 C7CF 474F
鹿 BCAF 3C2F

969 :デフォルトの名無しさん:2024/07/27(土) 15:59:47.68 ID:05H92w5k.net
>>968
区点表記だと
馬 39区47点
鹿 28区15点

970 :デフォルトの名無しさん:2024/07/27(土) 16:07:53.77 ID:y1baboQ5.net
+160

971 :デフォルトの名無しさん:2024/07/28(日) 10:15:58.80 ID:E5YepaJ3.net
>>969
おまえ絶望的にセンス無いのに
よくこの業界に居られるな

972 :デフォルトの名無しさん:2024/07/28(日) 10:17:52.25 ID:Z34FztXA.net
>>967
そろそろ逝って観ても良い頃だと思うの

973 :デフォルトの名無しさん:2024/07/28(日) 15:15:35.75 ID:v6kdbv5j.net
>>967
逝ってヨシ

974 :デフォルトの名無しさん:2024/07/29(月) 08:57:07.69 ID:zSUMdBzE.net
>>967
She never eats NONI.

975 :デフォルトの名無しさん:2024/07/29(月) 13:40:07.07 ID:vGDrvFgw.net
日本語の濁点や半濁点は結合済み文字を使うのが一般的だけど
℃は結合済みのU+2103ではなくU+00B0とU+0043を組み合わせる方が推奨されてるんだね

976 :デフォルトの名無しさん:2024/07/29(月) 14:02:50.71 ID:/aYuByy1.net
こまけぇこたぁいいんだよ!

977 :デフォルトの名無しさん:2024/07/29(月) 16:53:10.32 ID:DK2y9laS.net
そりゃそうだろ

978 :デフォルトの名無しさん:2024/07/30(火) 17:20:30.46 ID:PmWSmSbC.net
>>975
普通は「度」を使う。

979 :デフォルトの名無しさん:2024/07/30(火) 19:45:24.75 ID:WMxG7MZj.net
か に濁点で が だけど
か に◯をつけたい。です
 

980 :デフォルトの名無しさん:2024/07/30(火) 20:11:33.85 ID:6mlREWKo.net
Unicodeの記号は見た目はほとんど同じでも
意味が違えば違うコードポイントが割り当てられているから
Unicodeに登録されている意味の記号を使いたくなるが
互換文字とかの非推奨の記号もあるんだな
非推奨の理由は文字のルーツが関係してるのか

981 :デフォルトの名無しさん:2024/07/30(火) 21:10:09.15 ID:vxw4BH1o.net
か゜

982 :デフォルトの名無しさん:2024/07/30(火) 21:11:46.15 ID:nPiAUXL+.net
そろそろどうにかならんのかい
PowerAutomateのshift-jis CSV問題は

983 :デフォルトの名無しさん:2024/07/30(火) 21:18:41.51 ID:IMwqHlbY.net
>>980
あたりまえだろ

984 :デフォルトの名無しさん:2024/07/30(火) 21:20:10.53 ID:IMwqHlbY.net
UTF-8からUTF-16への変換がうまくできないのが互換性を維持しているWindows

985 :デフォルトの名無しさん:2024/07/31(水) 09:21:04.13 ID:8C2NHXAL.net
>>984
さすがにそんなことはないだろ
ぐたいれいがあったらおしえて

986 :デフォルトの名無しさん:2024/07/31(水) 13:18:27.03 ID:Qef+C1SH.net
>>985
話の流れを無視しているようだが、濁点、半濁点付きの仮名文字などは簡単じゃない。

987 :デフォルトの名無しさん:2024/07/31(水) 14:51:28.89 ID:8C2NHXAL.net
>>986
その辺の条件はUTF8とUTF16で完全一致なので変換自体で問題になる要素はない

988 :デフォルトの名無しさん:2024/08/01(木) 19:11:41.47 ID:Z3aS5qkf.net
ISO8859投稿テスト
NBSP ¡ ¢ £ ¤ \ ¦ § ¨ © ª « ¬ SHY ® ¯
° ± ² ³ ´ µ ¶ · ¸ ¹ º » ¼ ½ ¾ ¿
À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
à á â ã ä å æ ç è é ê ë ì í î ï
ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ

989 :デフォルトの名無しさん:2024/08/01(木) 19:19:00.54 ID:Z3aS5qkf.net
0xA5が5Cに変換された?

990 :デフォルトの名無しさん:2024/08/06(火) 11:07:32.22 ID:SBxTyrdX.net
¥

991 :デフォルトの名無しさん:2024/08/06(火) 11:35:36.48 ID:SBxTyrdX.net
なんで28個で折り返してるんだろω
https://i.sstatic.net/7ytba.png

992 :デフォルトの名無しさん:2024/08/06(火) 22:28:54.15 ID:M6OksvyX.net
JISキーボードだとBackSpaceの左のキーは¥で
Shiftの左のキーは\が書かれているのに
どちらを押しても0x5cが入力されるのも変な話だね

993 :デフォルトの名無しさん:2024/08/07(水) 14:25:40.64 ID:8wBmp3dB.net
>>991
それは28になる歴史的経緯があるんよ

994 :デフォルトの名無しさん:2024/08/07(水) 19:07:42.92 ID:ZGVac6R9.net
>>992
それは日本語環境だから

995 :デフォルトの名無しさん:2024/08/07(水) 20:25:10.83 ID:cN0FjkfN.net
フォント依存だものね

996 :デフォルトの名無しさん:2024/08/07(水) 23:32:09.80 ID:MkwAQvti.net
もともとJISキーボード規格にあったのは¥だけなんだけど
IBMが\を追加しちゃったからなんとなく0x5cを割り当てただけ。

997 :デフォルトの名無しさん:2024/08/09(金) 12:31:50.95 ID:7/oyIHAR.net
最初の素数だから

998 :デフォルトの名無しさん:2024/08/09(金) 16:03:09.36 ID:TQtqhYAu.net
>>996
そもそもキーボードの前に文字コードとしてJIS X 0201 で 0x5c には¥が割り当てられててバックスラッシュは存在していない
JISキーボードはもともと JIS X 0201 入力用なので¥を押したら 0x5c になるのが当然
その後にIBMとかマイクロソフトとかの国外勢が世界標準(アメリカ標準)のバックスラッシュを持ち込んでじわじわと 0x5c を¥記号から奪っていった

999 :デフォルトの名無しさん:2024/08/09(金) 18:19:42.95 ID:iV50uxYI.net
もじもじ

1000 :デフォルトの名無しさん:2024/08/09(金) 18:20:04.08 ID:iV50uxYI.net
もじもじ
もじもじ

1001 :デフォルトの名無しさん:2024/08/09(金) 18:20:26.33 ID:iV50uxYI.net
もじもじ
もじもじ
もじもじ

1002 :2ch.net投稿限界:Over 1000 Thread
2ch.netからのレス数が1000に到達しました。

総レス数 1002
311 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver.24052200