Skip to content

Remove continuous punctuation #17

@Iambestfeed

Description

@Iambestfeed

I used your cleaner and I noticed there is 1 feature that has not been integrated is the removal of constantly repetitive punctuation marks (minus ...)
Example:
{"rawContent": "Đang ngủ trưa, cô gái hốt hoảng phát hiện chủ trọ tự ý mở cửa lẻn vào phòng 😀???????", "cleanedContent": "Đang ngủ trưa, cô gái hốt hoảng phát hiện chủ trọ tự ý mở cửa lẻn vào phòng ???????"}

I think in this case response should be:
{"rawContent": "Đang ngủ trưa, cô gái hốt hoảng phát hiện chủ trọ tự ý mở cửa lẻn vào phòng 😀???????", "cleanedContent": "Đang ngủ trưa, cô gái hốt hoảng phát hiện chủ trọ tự ý mở cửa lẻn vào phòng ?"}

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions