sudo apt-get install chil... 更新 MacPorts 安装的软件到最新版本!
八月 23

Django 为字符编码的转换提供了非常简洁的方法:

django.utils.encoding.smart_unicode
django.utils.encoding.smart_str

我们在需要将用户提交的数据转换为 Unicode 的时候,可以使用 smart_unicode,而在需要将程序中字符输出到非 Unicode 环境(比如 HTTP 协议数据)时可以使用 smart_str 方法。拿 DDlog 来说,也有不少地方用到了这两个方法。

1、smart_unicode 在 DDlog 中的使用

Blog 的标签(Tag)一般多少会有中文,对于服务器环境来说,不会安装系统级的 UTF-8 环境,那么浏览器请求的 URL 中包含的中文会作为经过 urllib.quote 编码转换后的 UTF-8 字符串(注意,这种情况下,Django 不会自动转换为 Unicode),这里,我们在使用这个数据之前,需要进行一定的转换。

比较原始的方法类似如下:

def post_via_tag(request, tag):
    from urllib import unquote
    key = unquote(unicode(tag).encode('UTF-8'))
    tag_as = Tag.objects.select_related().get(tag__iexact = key)

而如果使用 Django 的 smart_unicode,明显简洁得多(也更符合 DRY 原则):

def post_via_tag(request, tag):
    from django.utils.encoding import smart_unicode
    tag_as = Tag.objects.select_related().get(tag__iexact = smart_unicode(tag))
    # ... other code

2、smart_str 在 DDlog 中的使用

DDlog 在接受评论的时候,会将评论者的姓名和邮件地址保存到 Cookie 中,以便该用户下次发表评论的时候自动显示相关信息。而评论者的姓名有可能是中文的,如果直接把中文字符串放到 Cookie 中,会引发 UnicodeEncodeError 异常。

这里需要进行去 Unicode 编码:

def post_comment(request, slug):
    # ... other prepare code
    response.set_cookie('COMMENT_AS_NAME', smart_str(comment_user.name), expired_at)

就这么简单便捷!

dirk 发表于 2009-08-23 星期日

0 Responses to “借助 Django 的 smart_str 和 smart_unicode 进行编码转换”

  1. 尚无评论

发表评论 »