HTMLのテーブルを​読み取ると、日本語が​文字化けしてしまいま​す。

日本語の文字を含むHTMLをreadtableを実行してテーブルを読み取ったとき、日本語が文字化けしてしまうのはなぜですか?
以下のコマンドを実行し読み取りました。
opt = htmlImportOptions('TableSelector',"//TABLE[1]");
table = readtable(url,opt);

 Accepted Answer

Kojiro Saito
Kojiro Saito on 1 Dec 2022
Edited: Kojiro Saito on 1 Dec 2022

2 votes

エンコードが合っていないためだと思われます。readtableにweboptionsも引数に入れられるので、日本語の文字コードを指定してみたらどうでしょうか。
webopts = weboptions('CharacterEncoding', 'Shift_JIS');
% webopts = weboptions('CharacterEncoding', 'UTF-8');
table = readtable(url,opt, 'WebOptions', webopts)

2 Comments

一眞 青木
一眞 青木 on 1 Dec 2022
ありがとうございます。ご指摘の通りにやり直したら解決しました。
Kojiro Saito
Kojiro Saito on 1 Dec 2022
解決して良かったです。

Sign in to comment.

More Answers (0)

Categories

Find more on プログラミング in Help Center and File Exchange

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!